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关系 型 数据 库 是 建立 在 关系 模型 基础 上 的 数据 库 ， 借 助 于 集合 代数 等 数学 概念 
和 方法 来 处 理 数 据 库 中 的 数据 。 关 系 型 数据 库 的 基础 关系 理论 被 认为 是 SQL 
的 基础 。 

本 书 为 我 们 讲解 了 什么 才 是 真正 的 关系 型 数据 库 ， 与 当前 的 数据 库 产品 相 比 ， 
它 的 特点 和 优势 是 什么 。 本 书 分 为 3 部 分 ， 共计 14 章 。 第 一 部 分 是 数据 库 的 基础 ， 
讲解 了 数据 库 基本 概念 ， 关 系 和 关系 变量 ， 人 码 、 外 人 码 和 相关 概念 ， 关 系 运算 符 ， 约 
束 和 断言 ， 关 系 模型 等 内 容 ; 第 二 部 分 讲解 了 事务 的 相关 概念 ， 以 及 如 何 设计 一 个 
好 的 数据 库 ; 第 三 部 分 则 讲解 了 SQL 相关 的 知识 ， 其 内 容 涵盖 了 SQL 基本 表 ，SQL 
操作 符 和 运算 符 ，SQL 约束 ，SQL 与 关系 模型 等 内 容 。 本 书 最 后 的 5 个 附录 涵盖 
了 Tutorial D 语法 、TABLE DUM 和 TABLE DEE、 集 合 论 、 关 系 演算 ， 以 及 与 关 
系 理论 知识 相关 的 资源 。 
本 书 适 合 数据 库 开 发 、 维 护 人 员 以 及 高 校 数 据 库 专 业 的 师 生 阅读 。 对 于 想 要 真 
里 解 什么 是 关系 型 系统 的 读者 来 说 ， 本 书 也 是 不 错 的 选择 。 
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O’Reilly Media, Inc. 介 绍 


O’Reilly Media 通 过 图 书 、 杂 志 、 在 线 服务 、 调 查 研究 和 会 议 等 方式 传播 创新 知识 。 自 1978 年 
开始 ，O"Reilly 一 直 都 是 前 沿 发 展 的 见证 者 和 推动 者 。 超 级 极 客 们 正在 开创 着 未 来 ， 而 我 们 关 
注 真正 重要 的 技术 趋势 一 一 通过 放大 那些 “细微 的 信号 ”来 刺激 社会 对 新 科技 的 应 用 。 作 为 
技术 社区 中 活跃 的 参与 者 ，O'Reilly 的 发 展 充满 了 对 创新 的 倡导 、 创 造 和 发 扬 光 大 。 


O’Reilly 为 软件 开发 人 员 带 来 革命 性 的 “动物 书 ”; 创建 第 一 个 商业 网 站 (GNN) ; 组 织 了 
影响 深远 的 开放 源 代码 峰会 ， 以 至 于 开源 软件 运动 以 此 命名 ， 创立 了 Make 杂 志 ， 从 而 成 为 
DIY 革 命 的 主要 先锋 ， 公 司 一 如 既往 地 通过 多 种 形式 缔结 信息 与 人 的 纽带 。O’Reilly 的 会 议和 
峰会 集聚 了 众多 超级 极 客 和 高 瞻 远 瞩 的 商业 领袖 ， 共 同 描绘 出 开创 新 产业 的 革命 性 思想 。 作 
为 技术 人 十 获取 信息 的 选择 ，O’Reilly 现 在 还 将 先锋 专家 的 知识 传递 给 普通 的 计算 机 用 户 。 无 
论 是 通过 书籍 出 版 ， 在 线 服 务 或 者 面授 课程 ， 每 一 项 O"Reilly 的 产品 都 反映 了 公司 不 可 动摇 的 
理念 一 一 信息 是 激发 创新 的 力量 。 


业界 评论 


“O’Reilly Radar 博 客 有 口 蕴 碑 。” 





Wired 


“O’Reilly 和 凭借 一 系列 (真希 望 当初 我 也 想到 了 ) 非凡 想法 建立 了 数 百 万 美元 的 业务 。” 
一 Business 2.0 
“O"Reilly Conference 是 聚集 关键 思想 领袖 的 绝对 典范 。” 


一 一 CRN 


“一 本 O’Reilly 的 书 就 代表 一 个 有 用 、 有 前 途 、 需 要 学 习 的 主题 。” 





Irish Times 


“Tim 是 位 特 立 独行 的 商人 ， 他 不 光 放 眼 于 最 长 远 、 最 广阔 的 视野 并 且 切 实地 按照 
Yogi Berra 的 建议 去 做 了 : “如 果 你 在 路 上 遇 到 岔路 口 ， 走 小 路 (岔路 ) 。” 回 顾 
过 去 Tim 似 乎 每 一 次 部 选择 了 小 路 ,而 且 有 几 次 部 是 一 闪 即 逝 的 机 会 ， 尽管 大 路 也 
不 错 。” 


一 一 Linux Journal 


译 者 序 


目前 , 现 有 大 量 新 型 数据 库 技术 得 到 了 快速 发 展 并 受到 大 量 关注 , 无 论 是 已 有 
进展 的 “ 云 计算 ”产业 ， 还 是 流行 的 关注 点 “大 数据 ” 其 核心 都 是 对 “数据 ”的 
上 
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研究 ， 这 就 使 得 数据 库 中 的 关系 理论 和 SQL 得 到 更 进一步 的 丰富 和 发 展 。 市 面 
关于 SQL 语言 或 者 关系 理论 或 者 二 者 兼 而 有 之 的 书籍 参差 不 齐 ， 良 劳 混杂 ， 很 难 
有 一 本 能 循序 渐进 深入 讲解 该 领域 的 书籍 。 本 书 译 者 结合 自己 多 年 工作 经 验 ， 结合 
实际 行业 内 需求 ， 挑 选 C.J Date 的 这 本 图 书 供 读者 参考 。 

C.T Date 是 最 早 认识 到 Code 在 关系 模型 方面 所 做 的 开创 性 贡献 的 学 者 之 一 ， 
他 是 关系 数据 库 技术 领域 中 非常 著名 的 独立 撰 稿 人 、 学 者 和 顾问 ， 他 使 得 关系 模型 
的 概念 普及 化 。 他 参与 了 IBM 公司 的 SQL/DS 和 DB2 两 大 产品 的 技术 规划 和 设 
计 。30 多 年 来 ，Date 一 直 活跃 在 数据 库 领 域 中 ， 他 的 著作 包括 : 《SQL 和 关系 理论 
(第 二 版 )》、《 数 据 库 设计 和 关系 理论 》、《 视 图 修改 和 关系 理论 》、《 数 据 库 系 统 导论 》、 
《对 象 关系 数据 库 基础 第 三 次 宣言 》 等 。 

本 书 共 分 为 14 个 章节 ， 内 容 分 别 为 关系 型 数据 库 “ 基 础 介绍 六 “事务 和 数据 
库 设计 ”、“SQL” 及 附录 四 个 部 分 ,翻译 团队 由 中 国电 力 科学 研究 院 信息 通信 研究 
所 相关 人 员 组 成 。 具 体 分 工 为 ， 前 言 、 译 者 序 、“ 基 础 介绍 ”部 分 由 张大 华 、 方 遇 
负责 ;“ 事 务 和 数据 库 设计 ”由 张大 华 、 方 帅 、 纪 务 、 李 哲 、 陈 相 舟 负 责 ;“SQL” 部 
分 由 谢 迎 军 、 丁 辉 、 常 亮 、 刁 倩 、 刘 月 林 、 钱 声 攀 、 惕 俊 负责 ， 附 录 部 分 由 上 述 
全 体 翻译 团队 共同 负责 ， 全书 译文 审核 与 校正 由 北京 航空 航天 大 学 柳 永 坡 、 张 硅 
完成 。 

本 书 中 文 版 能 够 出 版 发 行 ,首先 要 感谢 本 书 的 作者 ,是 他 们 为 我 们 著作 了 一 本 
好 书 。 其 次 要 感谢 人 民 邮 电 出 版 社 引进 了 本 书 ， 使 我 们 获得 了 翻译 此 书 的 机 会 ，3 
实现 将 其 介绍 给 国内 广大 读者 的 良好 愿望 。 也 借 此 机 会 向 本 书 的 技术 审 校 人 员 致 以 
崇高 的 敬意 ， 他 们 使 本 书 的 质量 与 水 平 向 前 迈进 了 一 大 步 。 此 外 , 特别 要 感谢 国家 
电网 公司 高 级 顾问 曾 楠 ， 他 以 巨大 的 热情 和 高 度 的 责任 心 在 本 书 翻译 过 程 中 给 予 
了 大 力 的 技术 指导 工作 。 也 要 感谢 幕后 的 工作 人 员 ， 是 他 们 的 辛勤 劳动 使 得 本 书 顺 
利 付 样 。 在 此 ， 译 者 代表 对 所 有 为 此 书 的 出 版 做 出 贡献 的 人 表示 深 深 的 感谢 和 这 高 
的 敬意 ! 












































































































































































































































































































































































































































































































































本 书 对 原著 的 错误 之 处 作 了 一 些 修正 ， 在 原著 难 懂 或 需要 提醒 的 地 方 添加 了 一 
些 译 者 说 明 。 尽 管 我 们 在 翻译 过 程 中 力图 做 得 更 好 ， 但 终究 因 业 务 水 平 、 英 文 水 平 ， 
乃至 中 文 文学 水 平 的 欠缺 ， 以 及 翻译 过 程 中 的 粗心 和 不 够 严谨 ,致使 本 译作 存在 错 
误 、 不 足 和 不 当 之 处 ， 也 恩 请 读者 批评 指正 ， 并 热切 期 望 读 者 对 本 书 提 出 宝贵 意见 
和 建议 。 

































































译 者 
2014 年 12 月 




















数学 科学 表明 的 是 原理 ， 它 








述 事 物 之 间 不 可 见 关 系 的 一 种 语言 。 
一 一 Ada, Countess of Lovelace, 
Quoted in Dorothy Stein (ed.): 
Ada: A Life and a Legacy (1985) 
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科学 的 本 质 是 ， 问 一 个 不 恰当 的 问题 ， 





于 是 走 上 了 通 往 恰当 答案 的 路 。 
Jacob Bronowski: 
The Ascent of Man (1973) 

















Hofstadter 定理 : 一 件 事 情 总 是 会 花费 比 你 预期 更 多 的 时 间 ， 就 算是 你 已 经 考 
虑 过 本 条 Hofstadter 定理 。 

















Douglas R. Hofstader: 
Godel, Escher, Bach: An Eternal Golden Braid (1979) 


献 辞 
说 将 本 书 献 给 我 的 妻子 Lindy 和 女儿 Sarah、Jennie。 我 爱 你 们 。 








C.J Date 是 一 位 独立 作家 、 演 说 家 、 套 


建树 。C. 本 Date 以 他 的 An Introduction to Database Systems〈 第 8 版 ，Addison-Wesley， 


关于 作者 

















究 员 、 顾 问 ， 在 关系 数据 库 技术 领域 颇 有 


























2004 年 出 版 ) 一 书 而 闻名 ， 到 写作 本 书 时 为 止 ， 该 书 发 行 量 已 达到 近 90 万 册 ， 被 





解释 


全 球 数 百 所 大 学 用 
包括 下 面 这 些 著 作 。 




















学院 使 用 。 他 还 出 版 了 许多 数据 库 管理 方面 的 著作 ,新 近 出 版 的 


Ventus: Go Faster! The TransRelations Approach to DBMS Implementation 











(2002 年 出 版 ，2011 年 再 版 ) 








Addison-Welsy: Databases, Types, and the Relational Model: The Third 


Manifesto( 第 3 版 ， 与 Hugh Darwen 合作 编写 ，2007 年 





FE 出 版 》 





Trafford: Logic and Databases: The Roots of Relational Theory (2007 年 出 版 ) 
和 Database Explorations: Essays on The Third Manifesto and Related Topics 
(与 Hugh Darwen 合作 编写 ，2010 年 出 版 ) 
Apress: Date on Database: Writings 2000-2006 〈2007 年 出 版 ) 和 The 
Relational Database Dictionary, Extended Edition (2008 年 出 版 ) 





O’Reilly: SOL and Relational Theory: How to Write Accurate SOL Code (第 











2 版 ,2012 年 出 版 )、Database Design and Relational Theory: Normal Forms 
and 411 That Jazz (2012 年 出 版 ) 和 View Updating and Relational Theory: 
Solving the View Update Problem(2013 年 出 版 ) 











Date 先生 于 2004 年 成 为 计算 机 工业 名 人 党 





























复杂 技术 课题 方面 具有 做 视 群 雄 的 能 





的 一 员 。 他 在 
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关系 数据 模型 是 百年 来 最 伟大 的 技术 发 明之 一 ， 它 是 我 们 完成 数据 库 领 域 任何 
事情 的 基础 。 的 确 ， 它 使 数据 库 管理 成 为 一 门 科学 ， 而 不 再 像 过 去 那样 是 一 些 技巧 、 
技术 和 经 验 法 则 的 特定 集合 。 因 此 ， 每 一 个 与 数据 库 管 理 有 关 的 专业 人 员 ， 或 多 或 
少 都 会 主动 去 获得 一 些 与 关系 模型 有 关 的 知识 ， 以 加 深 对 关系 模型 的 理解 。 因 为 如 
果 没 有 它 ， 想 开展 高 效 的 工作 、 获 得 较 高 的 工作 性 能 几乎 是 不 可 能 尽 

不 科 的 是 ， 想 要 达到 如 上 所 说 的 “获得 知识 ， 加 深 理解 ”是 不 容易 的 。 这 有 多 
方面 的 原因 , 但 影响 最 大 的 原因 是 SQL 语言 , 它 是 一 种 “关系 型 ”语言 的 官方 标准 ， 
当今 市 场 上 的 每 个 数据 库 产 品 都 支持 其 中 的 某 些 方面 。 大 家 普遍 承认 ， 至 少 是 应 该 
普遍 承认 , 作为 关系 模型 的 抽象 概念 的 某 种 具体 实现 ,SQL 有 着 非常 严重 的 缺陷 (这 
是 我 在 前 面 那 句 话 中 给 “关系 型 ”加 上 引号 的 原因 )。 至 于 在 数据 库 世 界 ， 每 个 人 
之 所 以 都 知道 一 些 关 于 SQL 的 知识 ， 是 几乎 所 有 的 关系 型 〈 或 可 能 的 关系 型 ) 教学 
的 重点 都 倾向 于 SQL 本 身 ， 而 不 是 基本 的 理论 。 因 此 ， 仅 仅 因 为 他 们 知道 SQL， 人 
们 就 认为 他 们 知道 关系 理论 ， 也 就 不 足 为 奇 了 。 然 而 ， 令 人 难过 的 是 ， 如 果 你 只 是 
像 这 样 知道 SQL， 那么 你 肯定 不 知道 关系 理论 ， 而 你 不 知道 的 事情 最 终 可 能 会 伤 
害 你 。 

本 书 的 首要 目的 就 是 详细 地 教 你 关系 理论 〈 至 少 是 尽 我 所 能 地 详细 )， 第 二 个 
目的 是 从 关系 理论 的 角度 描述 SQL (或 者 描述 SQL 的 核心 特征 ), 这 也 可 能 会 给 我 
带 来 一 些 其 他 灵感 ,一 些 读者 可 能 知道 , 不 久 前 我 出 版 了 男 一 本 书 来 论述 这 件 事情 ， 
书 名 为 SOL and Relational Theory: How to Write Accurate SOL Code (第 2 版 ，2012 
年 O’Reilly 出 版 )。 然 而 ， 与 现在 的 这 本 书 不 同 ， 早 期 的 图 书 主要 是 面向 数据 库 从 
业 人 员 ， 通 常情 况 下 适用 于 至 少 有 三 四 年 的 “工作 在 数据 库 系统 第 一 线 ” 的 人 员 ， 
或 者 经 常 把 它 作 为 日 常 工作 一 部 分 的 人 员 因此， 肯定 会 有 一 些 关 于 SQL 的 工作 
经 验 )。 那 本 书 的 主要 目的 是 展示 如 何 把 关系 理论 应 用 到 使 用 SQL 的 过 程 中 ， 因 此 ， 



































































































































































































































































































































































































































































































































1 多 年 来 ，SQL 已 经 演变 了 几 个 版 本 。 在 本 书 出 版 时 的 版 本 是 2011 版 〈 即 SQL:2011)。 规 范 的 引用 
格式 为 : 国际 化 标准 组 织 (ISO)， 数 据 库 语 言 SQL， 文 档 ISO/TEC9075:2011。 第 10 章 和 附录 卫 对 
这 种 引用 做 了 详细 的 介绍 ， 第 10 章 还 专门 简要 介绍 了 它 的 相应 发 展 史 。 
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SQL 的 行为 看 起 来 就 像 是 一 个 真正 的 关系 语言 一 样 〈 在 那 本 书 中 我 引用 的 一 个 规 
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是 , 从 关系 型 的 角度 使 用 SQL)。 在 本 书 和 那 本 书 之 间 不 可 避免 地 会 有 一 些 重复 。 




















实际 上 ， 本 书 中 有 一 些 文字 就 是 从 早期 写作 的 图 书 中 复制 和 粘贴 的 ， 有些 几乎 是 完 




















全 一 样 。 不 管 怎样 ， 你 现在 看 到 的 一 定 是 一 本 不 同 的 图 书 ， 因 为 它 是 面向 不 同 的 读 








者 (参看 下 面 的 详细 解释 )。 然 而 ， 本 书 接 下 来 的 内 容 还 需要 频繁 引用 早期 的 图 书 ， 









































所 有 的 引用 都 以 简写 的 形式 给 出 《 即 SQL and Relational Theory)。 而 且 ， 我 认为 如 果 
你 熟悉 我 的 早期 作品 ， 那 么 你 从 本 书 中 可 能 不 会 获得 太 多 的 知识 。 当 然 ， 我 不 是 不 






































鼓励 你 阅读 此 书 ， 只 是 如 果 你 读 


适合 的 读者 











了 ， 你 可 能 不 会 发 现 太 多 的 新 知识 。 























本 书面 向 的 读者 是 计算 机 专业 人 员 。 前 提 是 你 了 解 一 些 通 用 的 计算 机 和 编程 知 
识 ， 也 至 少 熟 悉 一 种 通用 的 编程 语言 。 但 是 你 不 需要 了 解数 据 库 ， 无 论 是 关系 型 的 

















还 是 其 他 的 ， 也 不 用 了 解 SQL。 




















当然 ， 你 至 少 要 知道 当今 的 数据 库 系 统 都 几乎 被 








假设 为 “关系 型 ”( 不 管 它 是 不 是 )， 但 是 我 不 会 依赖 于 这 个 假设 。 然 而 ， 请 注意 ， 




















如 果 你 恰好 已 经 了 解数 据 库 的 一 些 知识 ， 那 么 你 或 许 要 格外 留心 本 书 中 讲 的 内 容 ! 








你 可 能 会 发 现 需要 抛 掉 一 些 以 前 的 想法 〈 我 们 大 家 都 知道 ， 抛 掉 已 有 的 想法 是 很 难 









































的 )。 当 今 的 数据 库 产 品 即便 被 贴 上 了 “关系 型 ”的 标签 ， 但 实际 上 却 不 完全 是 3 
系 型 的 ,它们 在 很 多 方面 都 与 理论 上 的 关系 型 思想 相差 很 远 ,你 很 快 就 会 发 现 这 一 








点 。 正 如 我 在 SOL and Relational 














Theory 一 书 中 写 到 的 那样 : 


在 这 里 我 要 为 我 带 有 进攻 性 的 口吻 道歉 。 但 是 如 果 你 对 关系 模型 的 了 解 仅 仅 来 
自 于 对 SQL 的 了 解 ， 那 么 怒 怕 你 并 没有 如 你 所 期 待 的 那样 真正 了 解 关 系 模型 ， 你 
也 许 应 该 知道 “有 些 事情 不 是 这 样 的 ”。 我 也 不 能 过 于 强调 : SQL 和 关系 模型 不 是 


一 回 事 。 
注意 : 我 想 说 的 是 ， 关 于 本 














的 详细 材料 可 以 参照 我 的 一 个 在 线 论坛 ， 如 果 想 














要 更 详细 的 资料 ， 请 登录 网 站 ， 网 址 为 : www.justsql.co.uk/chris_date/chris_date.htm， 
也 可 以 参考 视频 ， 网 址 为 : http://oreilly.com/go/date。 














本 书 结构 


本 书 分 为 三 个 部 分 及 附录 。 第 一 部 分 为 “基础 知识 ”主要 介绍 了 关系 模型 本 


























身 ， 换 名 话说 ， 介 绍 了 关系 数据 库 技术 的 理论 基础 〈 虽 然 它 也 强调 了 整个 理论 的 实 
际 应 用 )。 第 二 部 分 为 “事务 和 数据 库 设 计 ” 主要 讨论 了 为 了 理解 通用 的 数据 库 和 
特定 的 关系 型 数据 库 而 需要 的 知识 , 但 是 不 需要 真正 了 解 关 系 模型 本 身 〈 除 非 它 以 





















































该 模型 作为 基础 )。 第 三 部 分 为 “SQL ”， 又 回 
讨论 的 概念 是 如 何 用 SQL 语 记 


录 通 党 





以 详细 
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sl 





再 一 次 感谢 我 的 妻子 Lindy， 她 在 本 
谢 所 有 的 前 辈 。 我 还 要 感谢 David Livingstone， 是 他 最 初 给 了 我 写本 书 的 





CE 














注意 : 复习 题 和 练习 是 大 部 分 章节 中 不 可 或 缺 的 一 间 
的 答案 之 前 尝试 着 回答 这 些 问题 ， 
目的 地 做 些 练习 ， 可 以 在 很 多 方面 得 到 锻炼 。 


致谢 


我 
同时 要 


以 使 自己 得 到 训练 。 尤 








到 
bn 
[2 


到 了 第 一 部 分 的 材料 ， 展 示 了 该 部 分 
实现 的 。 至 于 附录 ， 是 很 多 材料 的 混合 《这 也 是 附 
])， 我 认为 这 不 值得 在 书 的 正文 部 分 过 多 











因此 都 放 在 了 这 里 加 
































的 整个 著作 过 程 中 








了 分， 我 建议 你 在 查阅 后 面 
的 是 ,经常 有 








给 予 了 大 力 文 持 ， 
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其 他 的 由 O?Reilly 4 











版 的 著作 中 ，Allen 的 想法 为 此 黄 定 了 坚实 的 基 而 

















上， 就 像 本 书 








一 样 ， 也 是 芮 定 了 理论 基础 。 我 相信 他 是 对 的 ， 这 就 是 我 想 要 写 的 彰 作 )。 最 后 ， 
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第 一 部 分 


基础 知识 


各 各 = 
1 


日 


数据 库 基 本 概念 


我 们 的 生活 被 琐事 浪费 掉 了 …… 简 化 ， 简 化 。 
Henry David Thoreau: Walden (1854) 





本 章 是 一 个 介绍 性 的 概述 ， 目 的 是 提供 一 个 距离 我 们 非常 晃 远 的 观点 。 它 
故意 没有 讲解 得 很 深奥 ， 如 果 你 已 经 了 解 了 关于 数据 库 管 理 的 一 些 知识 ， 也 许 
会 发 现 本 章 内 容 都 已 熟悉 。 但 是 我 想 你 应 该 伦 些 时 间 把 本 章 从 头 到 尾 通读 一 过 
这 是 非常 值得 的 ， 如 果 只 是 想 获得 背景 知识 ， 可 以 看 后 续 的 章节 。 同 时 ， 本 章 还 
介绍 了 一 些 可 以 运行 的 示例 ， 在 后 面 的 章节 中 我 们 也 一 定 会 遇 到 这 些 例子 ， 并 逐 


步 熟 悉 。 
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1.1 什么 是 数据 库 


数据 库 被 认为 是 一 种 电子 文件 柜 ， 它 包含 了 一 些 数字 化 的 信息 《〈 即 数据 )， 这 
些 信息 可 以 被 永久 保存 在 某 种 存储 介质 上 , 通常 是 被 保存 在 磁盘 上 。 用 户 可 以 通过 
管理 数据 库 的 软件 发 出 请 求 (request) 或 命令 (command) 来 向 数据 库 中 插入 信息 ， 
删除 、 修 改 或 检索 数据 库 中 已 经 存在 的 信息 ， 这 种 管理 数据 库 的 软件 叫做 数据 库 管 
理 系 统 (DBMS )。 

注意 : 

在 本 书 中 ， 术 语 user 的 含义 将 根据 上 下 文 的 要 求 理解 为 应 用 程序 员 或 者 是 交互 
用 户 :或 者 是 应 用 程序 员 和 交互 用 户 。 

实际 上 ， 现 在 这 些 发 给 DBMS 的 用 户 请 求 可 以 采用 各 种 各 样 的 方法 进行 格式 



























































































































































1 这 里 仍然 指 的 是 计算 机 专业 人 员 ， 而 不 是 一 个 天 才 的 “终端 用 户 ”， 他 可 能 会 合理 地 忽略 掉 本 书 中 
讨论 的 大 部 分 内 容 。 




















4 第 1 章 数据 库 基本 概念 





















































化 《例如 ， 单 击 鼠 标 )。 然 而 ， 为 了 达到 我 们 的 目的 ， 采 用 某 种 正规 语言 中 的 简单 





文本 串 的 形式 
能 会 这 样 写 : 


EMP WHERE 











这 
今 
区 
民 
天 























JOB = 'Programmez 

















些 请 求 会 更 方便 些 。 例如， 有 一 个 人 力 资源 数据 库 ， 我 们 可 


这 个 表达 式 表 示 了 一 个 检索 请 求 (retrieval request) 一 一 但 通常 我 们 都 称 之 为 查询 
(query) 一 一 这 个 表达 式 的 含义 是 要 获得 员工 工作 性 质 为 Programmer 的 员工 信息 。 


可 以 运行 的 例子 
了 某 种 类 型 数据 库 中 的 一 些 样本 数据 ， 包 含 供应 商 表 (suppliers)、 


图 1.1 给 出 
零件 表 (parts)、 











8 






































货物 表 (shipments， 即 

















SNAME STATUS CITY 


London 
Paris 
Paris 
London 
Athens 


























供应 商 提供 的 零件 数量 )。 





OVY 


300 
200 
400 
200 
100 
100 
300 








0 
pe 
.0 
.0 
.0 
(0) 


London 
Paris 
Oslo 
London 
Paris 
London 





400 
200 
200 
300 
400 





























们 都 是 由 行 和 列 








口 表 S 代 
一 个 唯 
中 给 出 
商 位 置 























口 表 P 





























图 1.1 供应 商 表 和 零件 表 数 
从 图 1.1 可 以 看 











局 库 一 一 样本 数 居 


上 ， 这 个 数据 库 包 含 了 三 个 文件 〈file) 或 称 之 为 表 (table)。 
(实际 上 它们 就 是 关系 ”Lrelations ]， 我 们 将 在 多 
“文件 ”或 者 “ 表 ”。) 这 些 对 








入 2 章 讲 解 ， 但 在 本 章 中 我 们 称 之 为 
的 名 称 分 别 为 S、P 和 SP。 因为 它们 都 是 表 ， 所 以 它 


























TH 


解 。 





一 的 供应 商号 CSNO )、 妈 





组 成 的 (在 传统 的 文件 术语 
字段 )。 可 以 按照 如 下 的 方式 来 理 








ph， 行 对 应 为 文件 中 的 记录 ， 列 对 应 为 





> 





表 签 署 了 合同 的 供应 商 (suppliers under contract)。 每 个 供应 商都 有 








FE 名 (SNAME) (姓名 必须 唯一 ， 图 1.1 
的 样本 数据 中 姓名 唯一 只 是 巧合 )、 一 个 状态 值 (STATUS)、 供 应 









































(CITY)。 注 意 : 在 本 书 的 其 他 位 置 ,“ 签 署 了 合同 的 供应 商 ” 都 
缩写 为 供应 商 (suppliers)。 











\ 表 零件 的 种 类 (kinds ofparts)。 每 种 零件 都 有 一 个 唯一 的 零件 号 码 





CPNO)、 零 伴 称 
零件 储存 位 置 
写 为 零件 (parts )。 
J 表 SP 代表 供应 关系 (shipments), 即 表明 零件 从 四 














主意 : 在 本 
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(PNAME )、 雪 # 放 (COLOR)、 叶 # 重量 (WEIGHT)、 














的 其 














,“ 零 件 的 种 类 ”都 缩 




















< 


里 运输 或 者 由 哪个 供应 

















商 来 提供 。 每 个 供应 关系 都 有 一 个 供应 商号 (SNO)、 一 个 零件 号 (PNO) 


以 及 供应 数量 (QTY )。 因 
上 之 间 至 多 有 一 种 供应 关系 , 所 以 由 供 
一 个 唯一 的 供应 关系 。 


零 人 














为 在 特定 的 





















































间 内 ， 一 个 特定 的 供应 商 和 特定 
应 商号 和 零件 号 组 合 在 一 起 表示 











本 书 中 其 他 地 方 的 例子 大 多 是 基于 前 面 提 到 的 这 个 数据 库 。 现在， 你 可 以 再 仔 








纪 














Relational Theory'!， 在 许多 现场 演 i 
是 就 像 我 在 别处 写 
习 是 有 帮助 的 ， 而 不 是 障碍 。 当 多 
子 复 杂 得 多 , 但 是 使 




















细 看 看 前 面 的 这 个 数据 库 ， 我 已 经 在 很 多 其 





























了 样 , 我 相信 在 各 种 不 同 的 







































































他 的 书籍 和 著作 中 用 过 ， 包 括 SQL and 








时 也 用 过 ， 所 以 你 可 能 会 有 点 厌烦 的 感觉 。 但 
版 物 中 使 用 相同 的 一 个 例子 对 学 
A ， 真 正 的 数据 库 应 该 比 这 个 像 “ 玩 具 ” 一 样 的 例 





























接近 于 实际 的 例子 会 遇 到 的 麻烦 就 是 它们 太 复 杂 了 ,在 茶 种 
程度 上 会 造成 只 见 树 木 不 见 森 林 的 结果 。 所 以 我 还 是 要 说 ,即使 这 个 例子 有 点 不 现 








实 , 但 供应 商 和 零件 表 数 据 库 至 少 适合 说 明 我 们 后 面 要 测试 的 所 有 观点 。 因 而 ， 








达到 本 书 的 目的 ， 这 个 例子 足够 了 。 但 要 注意 的 是 ,所 


















































要 
其余 部 分 的 例子 中 ， 除 





非 做 特殊 说 明 ， 和 否则 我 会 假定 使 用 图 1.1 所 示 的 特定 的 样本 数据 。 


1.2 什么 是 数据 库 管理 系统 


从 现在 开始 ， 每 当 我 提 到 “给 
出 一 个 如 用 户 想象 的 导 


























一 个 典型 的 数据 库 ?， 如 
b 样 的 数据 库 (有 时 称 之 为 


逻辑 数据 库 [logical database ])。 逻 辑 数据 库 与 物 














理 数 据 库 是 相对 而 言 的 ， 物 到 


数据 库 是 被 数据 库 管 











理 系 统 (DBMS，Database Management System ) 











所 理解 的 ( 即 它 是 实际 存 
据 )。 因 此 ， 需 要 进 





























嵌 在 计算 机 中 的 数 
步 强调 的 是 ， 这 里 所 谓 的 

















个 守 企 








迪 辑 和 物 型 


月， 


一 











数据 库 并 不 是 两 个 完全 不 同 的 事 
昌 反 ， 它 们 是 从 不 同 视 角 来 看 待 的 同一 事 


相 
情 ， 如 图 1.2 所 示 。 




















1 本 书 的 前 言 












































图 1.1 所 示 ， 意 味 着 给 








供应 商 、 零 件 和 供应 关系 


(逻辑 数据 库 ) 





数据 库 管 理 系统 (DBMS) 








实际 存储 的 数据 
(物理 数据 库 ) 











图 1.2 ”数据 库 系统 结构 





缩写 形式 “SO7 and Relational Theory” 代 表 我 的 著作 SOL 


and Relational Theory: How to Write Accurate SOL Code (第 二 版 ，O’Reilly, 2012)。 











之 间 的 一 个 媒介 








这 些 请 求 。 





1.2 可 以 看 出 ，DBMS ( 即 管 


数据 库 基 本 概念 














， 可 以 有 效 地 提供 以 下 服务 : 用户 向 
依据 逻辑 数据 库 的 形式 来 标 


识 


/Ny 





里 数据 库 的 软 











牛 ) 作为 系统 逻辑 层 和 物理 层 






































DBMS 提 供 的 





个 通用 功能 就 是 向 用 户 隐 藏 系统 物 到 

















的 程序 设计 语言 也 是 在 物理 级 别 向 用 户 隐 藏 实 














提供 了 一 个 更 抽象 的 数据 库 概 念 ， 相 比 物 到 
例如 : 以 实际 存储 在 系统 中 

现在 我 们 知道 了 DBMS 是 一 个 复杂 的 软件 ， 
为 它 是 这 本 书 的 主题 ， 
主要 职责 是 决定 如 何 正 有 
请 求 〈“ 实 际 上 几乎 是 所 有 的 请 求 ) 都 能 够 通过 各 种 不 同 的 方法 来 实现 。 
同 的 方法 一 般 在 性 能 特点 上 有 很 大 
以 从 儿 微 秒 





件 我 现在 必须 提 一 下 ， 因 


器 是 DBMS 的 构件 


这 些 不 
有 很 大 








区 别 ， 可 























i 


[一 
CC 




















pg 


已 








EE 级别 
现 细节 )， 换 句 训 


包含 很 多 构件 。 
就 是 优化 器 (optimizer )。 优 化 

















数据 库 发 出 请 求 的 格式 可 以 
然后 依据 对 应 的 物理 数据 库 ，DBMS 会 一 一 实现 


的 实现 细节 (大 多 数 
6 说 ，DBMS 给 用 户 
数据 库 级 别 而 言 ， 这 种 方式 会 更 友好 。 
的 方式 来 表示 数据 库 概 念 !'。 
































这 二 沁 




















但 是 有 


个 构 





执行 用 户 的 请 求 。 大 多 数 
































到 几 天 。 














performance )。 


法 去 实现 特定 的 请 求 是 非常 重要 的 ， 这 如 






































前 文中 存在 一 个 直接 而 月 





重要 的 暗示 就 是 假设 优化 器 





























1.2.1 数据 依赖 
逻辑 数据 库 和 物理 数据 库 是 有 区 别 的， 要 严格 进行 


们 实现 一 个 重要 的 
实 不 是 一 个 很 恰当 

















说 一 下 ,这 








用 户 根本 不 必 考 虑 性 
我 脑海 中 闪现 的 一 个 想法 )， 记 录 一 直 是 关系 模型 中 的 一 个 主要 目 
该 是 系统 所 担忧 的 ， 而 不 是 用 户 应 该 关 
有 达到 ， 就 说 明 系 统 是 失败 的 《或 者 确 

















能 的 问题 。 但 有 





个 事实 我 必须 在 这 





区 别 。 特 别 是 在 执行 时 间 - 
因而 ， 对 了 





全 已 7 


能 很 好 地 发 挥 它 的 作用 ， 
里 声明 一 下 (这 是 突然 在 

































































标 ， 








们 可 以 随意 改变 数据 在 系统 











标 ， 











性 
心 的 。 从 某 种 程度 上 来 说 ， 如 果 这 个 目 
切 地 说 ， 至 少 是 不 成 功 的 )。 





就 是 数据 独立 性 (data independence ) 。 


























+ 二 


上 它们 确 
优化 器 来 说 ， 选 择 一 个 “好 ” 方 
的 “好 ”实际 上 是 指 好 的 性 


而 且 ， 


7 


头 

















能 (good 




















能 问题 应 


标 没 





区 分 , 但 这 个 事实 也 允许 我 
数据 独立 性 (顺便 











的 数据 ,但 似乎 我 们 也 只 能 ! 
的 存储 和 访问 方式 ,而 对 于 月 











] 它 ) 意味 着 我 





使 


不 二 











日 户 看 到 的 数据 库 却 不 需 





要 做 任何 相应 的 变化 。 其 实 我 们 可 能 想 改 变数 据 库存 储 或 访问 方式 的 原因 就 是 性 能 
(performance)。 我 们 做 这 样 的 改变 而 不 用 去 修改 用 户 看 到 的 数据 库 , 这 意味 着 已 存 








1 顺便 说 一 下 ， 





虽然 物 到 



































多 成 分 ， 如 存储 的 文件 或 索引 ， 这 些 存 储 的 文件 或 索引 以 一 种 更 低级 别 和 
空间 。 页 或 磁盘 空间 相应 地 又 是 一 些 更 低级 别 组 成 成 分 的 
身 也 是 一 种 抽象 (抽象 的 级 别 可 以 很 深 只 要 你 能 想像 的 到 )。 




















数据 库 不 如 逻辑 数据 库 














象 ， 但 它 仍然 是 经 过 抽 









































AI 








象 后 形成 的 。 它 一 般 包 含 很 
的 方式 来 表示 ， 如 页 或 磁盘 
象 ， 如 二 进 制 位 或 字 节 ， 


然 ， 它 们 本 











在 的 一 些 应 








] 程 请 








党 重要 的 一 点 是 数据 独立 物 
数据 库 设 计 或 者 其 他 事 1 





用 程序 、 用 户 培训 、 





1.2 什 


、 查 询 等 都 可 以 在 变化 之 后 仍然 按照 原来 的 方式 工作 。 因 出 





么 是 数据 库 管理 系统 7 


上 ,， 非 











1.2.2 ”DBMS 的 其 他 功能 


生 可 以 保护 已 存在 


些 资 


的 资产 , 这 
青 中 。 


产 

















再 重复 一 下 ，DBMS 是 逻辑 数据 库 和 物理 数据 库 

















间 的 














它 文 持 通 向 数据 库 的 接口 (interface )( 在 本 书 中 的 其 他 地 方 ， 








用 数据 库 [databasej] 





此 ，DBMS 的 主要 职责 包括 : (a) 负责 

















改 ， 











来 专门 表 














可 以 存在 于 已 有 的 应 








一 个 媒介 。 换 句 话说 ， 


我 一 直 不 加 限 秆 





I 地 使 

















示 迪 辑 数 据 库 ， 除 非 在 上 下 文 环境 中 男 有 要 求 )。 因 
接收 用 户 请 求 





， 这 些 请 

















体形 式 要 根据 则 辑 数据 库 的 要 求 来 决定 :〈b) 





通过 解释 











请 求 做 出 响应 ， 换 名 
极 少 的 情况 下 ，， 
存在 的 数据 等 这 类 请 














真正 的 存储 形式 等 




















话说 ， 就 是 根据 物 








术语 修改 (update) 一 般 
青 求 。 
因此 ，DBMS 可 以 “保护 
































真正 意思 思 是 ， 它 提供 





和 恢复 等 〈recovery ) 


从 兴 





了 安全 性 (security )、 
控制 。 
来 保证 





人 HE 
镭 | 









































安全 控制 : 
作 ， 人 允许 他 
些 用 


日 























或 地 来 扣 
户 可 能 


里 数据 库 的 形式 来 执行 这 些 请 求 。 注 意 
新 数据 、 删除 或 修改 已 























来 指 的 是 插入 











并 发 性 





要 说 明 如 下 。 
I 户 请 求 的 合法 性 。 即 有 疑 
和 作 有 权利 访问 的 数据 。 
会 被 允许 查看 供 


问 的 
侈 如 ， 在 
应 商 状态 数据 ; 





























止 





许 碍 看 











也 城市 的 供应 商 ; 


mi 


二 


不 














某 些 











坚 用 户 可 以 被 角 


求 可 以 是 查询 或 者 修 
或 执行 的 方式 对 这 些 
意 : 在 











] 户 已 有 的 数据 ”( 例 如 ， 可 以 保护 数据 在 系统 内 部 
细节 )。 我 们 可 以 有 些 得 意 地 说 ， 它 保护 了 用 户 数据 。 但 是 我 的 
(concurrency)、 完整 性 (integrity) 





] 户 正在 请 求 一 个 操 
内 应 商 和 零件 数据 库 


多 


某 些 用 户 可 能 根本 就 





















































是 很 重要 的 ， 但 对 





安全 控制 








Ct 许 查 看 伦敦 的 供应 
用 户 可 以 被 允许 检索 供应 商 信 
昌 户 执行 那些 他 们 允许 





商 ， 但 不 允许 
息 但 不 允许 修 
被 执行 的 操作 。 注 

















的 更 多 细 市 











J 














简短 的 




















述 )。 














发 控制 
题 。 假 设 你 


后 继续 提问 











关系 时 ， 这 是 一 个 让 人 很 讨厌 的 事 
户 删 除了 这 些 数据 。 
的 第 二 部 分 对 其 进行 详细 














就 是 要 处 到 





同一 时 间 可 能 





pe = 




















要 查询 数据 库 中 是 否 


供应 商 S1 供应 的 











量 . 不 右 











了 多 个 用 户 使 


介绍 已 经 超出 了 本 书 











同一 数据 库 的 问 


商品 ， 得 到 肯定 回答 


























供应 的 零件 数量 平均 


/、\ 








直 是 多 少 , 当 被 告知 























并 发 控制 的 
解 。 
































1 这 种 极 少 


的 情况 是 很 重要 的 ， 


完整 性 控制 : 就 是 要 保证 数据 库 中 的 数据 是 正 有 








情 。 推 测 一 下 ， 可 











百 。 











目的 就 是 




















外 的 





章 后 面 的 练习 1.2。 


民 本 没有 这 样 的 供应 
能 是 因为 一 些 其 他 用 




















要 处 理 这 样 的 问题 ， 我 将 在 本 书 





因为 在 某 种 程度 上 提 
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第 1 


章 











供 





这 样 的 保 记 
的 供应 关系 记录 ， 如 果 供 应 


数据 库 基 本 概念 








拒绝 。 同 检 











控制 是 相当 习 











F 是 可 能 的 )。 例 如 ， 要 向 供应 关系 的 表 中 搬入 











| 





商 表 
FE， 要 把 供应 商 S1 的 状态 值 
定 不 能 超过 100， 则 这 个 请 求 也 会 被 
E 要 的 ， 我 将 在 第 3 章 和 第 


13 章 也 会 涉及 完整 性 控制 )。 


恢复 控制 ; 





情 。 








也 就 是 说 ,一 旦 数据 被 插入 到 数据 库 









































6 


就 是 假设 数据 库 从 不 会 忘记 任何 号 








条 供应 商 S6 


PF 没有 S6 供应 商 ， 则 这 个 请 求 一 定 会 被 
网 改 为 200 时 ， 如 果 这 个 状态 值 规 
E 绝 。 这 些 例子 还 不 足以 说 明 完 整 性 


























;中 对 其 














此， 





一 > 


十 
月 ， 














ph， 就 














进行 详 





纪 





讲解 “在 第 








它 会 一 直 记 得 所 有 的 事 
也 不 会 被 删除 了 《除非 





用 户 有 特别 明确 的 要 求 )， 即 使 发 生 一 些 失败 的 操作 ， 如 系统 被 破坏 或 者 





磁盘 被 破坏 。 我 将 在 本 书 的 第 二 部 分 对 其 进行 讲 
最 后 ， 关 于 DBMS， 我 还 要 说 一 件 
出 ， 有 一 点 是 相当 清楚 的 ,为 




















据 的 仓库 ， 而 DBMS 是 管 


据 库 (database) 表示 DBMS 已 经 很 
非常 普通 了 ， 在 本 书 























R12 

















日 








[我 不 会 


/. 




















事情 。 从 我 前 
就 是 数据 库 之 间 的 逻辑 
里 这 个 仓库 的 软件 。 不 幸 的 
遍 了 !， 但 我 想 3 
此 种 说 法 。 

















解 。 








面 ; 





























那 真正 的 数据 库 又 是 什么 呢 ， 这 是 个 问题 。 


1.3 什么 是 天 系 型 DBMS 


现在 我 们 已 经 久 


站 


蕊 


方 


加 容易 的 一 种 规则 《〈 在 菜 些 方面 ， 对 系统 来 说 也 更 
现在 ， 虽 然 这 种 方法 有 时 看 上 去 稍 
既然 正 ] 





是 一 个 DBMS， 它 要 提 
修改 、 恢 复 控制 、 并 发 探 人 
功能 。 但 是 





;} 云 。 

















有 和 一 已 


;办 


中 违 


























供 本 章 介 


绍 











央 、 安 全 探 作 











外 局 


/yy 















































个 











1 

















的 

















型 的 例子 ， 大 家 几乎 可 以 
源 数据 库 ”。 但 是 它 不 是 ， 它 也 许 是 世界 上 最 受 欢迎 的 
但 不 是 数据 库 。 











Lu 














解 的 每 一 件 
结构 是 有 


事情 中 可 以 看 
区 别 的 ， 它 是 存储 数 














， 在 数据 库 领 域 使 用 术语 数 
调 的 是 ， 这 个 术语 已 经 非常 











了 什么 是 DBMS， 但 什么 是 关系 型 DBMS 呢 ? 当然 ， 首 先 
的 DBMS 具备 的 所 有 功能 : 
唱和 完整 性 控制 ， 以 及 本 书 


数据 存储 、 查 询 、 
FP 没 有 讨论 的 其 他 














因为 如 果 要 把 DBMS 称 为 数据 库 ， 

















在 继续 讲解 之 前 ， 还 要 强调 一 点 ， 这 个 方法 ( 即 关 系 模型 ) 划 
模型 的 这 些 方 法 并 不 是 紧身 衣 ， 相 反 ， 它 们 是 一 利 








FP 规则 ， 对 月 




















要 注意 的 是 ， 它 又 是 关系 型 的 ， 这 就 意味 着 用 户 接口 在 真正 
时 必须 是 关系 模型 。 换 名 话说， 关系 模型 被 看 作 是 DBMS 上 





实现 














实现 用 户 接口 的 一 种 











实 很 简单 ! 关系 





























复 


不 


E Internet 上 随处 看 到 这 术 


由 
党 




















昌 户 来 说 可 以 是 生活 更 











户 的 )。 





A 让 
上 团 导 


#， 但 是 重点 是 针对 
日 最 重要 的 是 ， 关 








系 模型 是 很 正规 的 。 









































规 就 需要 有 正规 的 术语 ， 正 规 的 术语 有 时 会 令 人 却步 。 但 是 术语 中 的 这 些 定 


一 种 现象 :“MySQL 是 世界 上 最 受 欢迎 
源 数据 库 管 理 系统 〈 我 也 不 太 清 楚 )， 


























1.3 什么 是 关系 型 DBMS 9 


义 实际 上 相当 简单 ( 别 忘 了 ， 供 应 商 和 零件 数据 库 就 相当 容易 理解 ， 不 是 吗 
事实 上 ， 我 们 谈论 的 这 些 定义 要 比 过 去 使 用 的 类 似 定义 简单 得 多 ， 就 像 IMS 和 IDMS 
这 样 的 前 期 关系 系统 或 非 关 系 系统 !。 
再 重复 一 下 ， 关 系 型 数据 库 管 理 系统 是 支持 真正 实现 关系 模型 的 用 户 接口 的 
DBMS。 对 用 户 而 言 ， 其 含义 如 下 。 


Ne 


过 





正 含义 ， 


ym 





































































































口 ”数据 看 上 去 是 关系 型 的 。 


























? )。 






































改 请 求 的 基础 。 举 个 简单 的 例子 ， 如 : 








S WHERE CITY = 'London' 





























这 个 表达 式 表示 查询 供 货 地 点 在 London 的 供应 商 , 它 使 用 了 关系 型 的 “ 

















符 。 规 范 的 表达 就 是 ， 它 请 求 在 表 $ 中 查询 地 点 在 London 的 供 




















然后 ， 在 本 书 的 第 一 部 分 中 ， 我 们 将 仔细 看 看 “数据 看 上 去 是 关系 型 的 ”的 真 
我 们 也 要 检验 各 种 关系 运算 符 ， 看 它们 是 否 能 起 到 作用 。 然 后 ， 要 污 
是 ， 这 种 解释 也 不 一 定 是 非常 详尽 的 〈 这 些 主题 
Relational Theory)， 但 是 就 现状 来 说 ， 它 是 非 









































口 “ 可 以 使 用 关系 运算 符 〈 如 ， 采 用 关系 运算 来 处 理 数 据 ) 作为 检索 请 求 和 修 


限定 ” 


应 商 集合 。 





FE 意 的 




















第 综合 的 ， 也 是 非常 准确 的 。 


不 柱 的 是 , 这 里 还 有 一 个 问题 。 为 了 说 明 这 些 定义 , 我 们 还 要 讨论 一 些 














































































































| 
TH 

















的 详尽 解释 可 以 参照 SOL and 


问题 ， 


[我 需要 明确 给 出 一 些 编码 实例 。 为 了 表达 这 些 实例 ， 我 需要 采用 正式 的 语言 来 
述 ， 但 是 关系 模型 没有 规定 任何 一 种 这 样 的 语言 ， 而 且 它 是 在 很 高 的 抽象 级 别 
上 定义 的 ， 原 则 上 是 能 够 来 具体 实现 任何 不 同 的 语法 形式 。 现 在 ， 一 种 标准 的 、 
具体 的 语言 确实 存在 了 ， 即 SQL， 目 前 在 市 场 上 它 也 或 多 或 少 地 于 
数据 库 产品 的 支持 。 然 而 就 像 在 前 言 中 提 到 的 ，SQL 是 有 很 多 缺点 的 ， 比 如 它 的 
复杂 性 、 不 完整 性 、 难 掌握 ， 在 很 多 方面 还 容易 造成 误导 。 因 此 我 计划 编写 本 书 
的 目的 如 下 。 
DD ”第 一 ， 我 会 在 根本 不 使 用 SQL 的 情况 下 来 解释 关系 模型 ( 见 本 


得 了 所 有 主流 





的 第 一 


部 分 )。 作 为 蔡 代 ， 我 使 用 了 一 种 叫做 Tutorial D 的 语言 ， 它 是 专门 为 此 



































目的 设计 的 一 种 语言 。 注 意 : 我 相信 Tutorial D 是 一 种 可 以 自我 说 明 的 语 


言 。 然 而 , 如 果 需 要 更 容易 理解 这 种 表述 的 话 , 可 以 参考 Databases, Types, 
and the Relational Model: The Third4 Manifesto( 第 三 版 ，Addison- Wesley, 





1 这 要 比 各 种 建议 中 提 到 的 类 似 定义 简 














是 因为 有 关系 模型 作为 替代 〈 例 如 : XML、NoSQL、 



































多 了 《但 这 种 外 





























D 错 大 频繁 了 ， 这 样 说 我 感到 非常 抱歉 )， 这 
色 模 型 等 )。 顺 便 说 一 下 ， 我 从 来 没有 看 见 
过 这 样 一 种 建议 ， 即 提出 这 种 建议 的 人 真正 理解 了 关系 模型 。 可 以 肯定 的 是 ， 如 果 你 想 声明 
不 好 ， 需 要 用 技术 B 替代 ， 那 么 对 于 你 来 说 首先 理解 技术 A 就 是 一 项 义不容辞 的 职责 ， 尤 
证 明 技术 B 如 何 解 决 了 特定 的 问题 ， 而 技术 A 不 能 解决 。 


技术 A 


三 恒 : :7 
其 是 要 
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2007) '。 


AAA 一 


外 一 ， 


我 将 展示 关系 模型 的 思 





























想 是 如 何 





三 部 分 )， 因 
只 要 够 用 即 可 ， 




















此 可 以 肯定 的 是 ， 我 并 不 是 要 在 本 书 中 








lL 体 用 SQL 实现 的 ( 见 本 书 的 第 
P 全 面 介绍 SQL 语言 ， 


即 我 在 前 言 中 提 到 的 语言 的 核心 特征 。 





(第 二 部 分 是 对 前 言 中 提 到 的 问题 所 做 的 简短 说 明 〉 注意 : 也 许 我 应 该 声明 一 











下 ， 









































在 结束 本 节 前 ， 
关系 模型 最 早 是 | 
























































于 前 面 提 到 的 计划 , 接 下 来 进行 的 工作 可 能 与 目前 市 场 上 的 大 部 分 书籍 或 报 
告 不 太一 样 ， 所 以 我 打算 叫做 “关系 数据 库 的 介绍 ”。 
再 说 明 一 点 。 你 也许 知道 , 但 也 许 不 知道 











(但 是 我 希望 你 知道 


): 

















E.F.Codd 发 明 的 ， 当 时 他 还 是 IBM 的 一 名 硬 





+ 














Edgar，F 代表 Frank， 但 他 





喜欢 








] 首 字母 签名 ， 作 为 他 的 月 

















傲 )。1968 年 末 ，Codd 已 经 成 为 了 一 名 数学 家 ， 他 第 一 次 实 


来 把 一 些 回 有 的 原理 用 在 某 








到 的 。 他 在 关系 模型 上 最 初 产生 的 一 些 思想 可 以 在 1969 年 IBM 的 研究 报告 中 找 


一人 


负 


域 中 


到 (进一步 的 研究 可 以 参见 附录 E)。 





1.4 
这 两 个 概念 好 像 不 太 好 
数据 库 系统 就 是 一 个 程序 系统 














段 ， 这 段 代 码 日 





VAR I ， 
VAR A A 
SUM := 
I := 0 
DO WHIL 





END DO ， 
DISPLAY 











1 在 本 书 第 一 版 出 版 之 后 ，Tutorial D 已 经 修订 并 扩充 了 一 些 内 容 。 修 订 版 本 的 
的 就 是 修订 版 ) 可 以 在 Hugh Darwen 和 我 的 另 一 本 书 中 找到 ， 即 Database Explorations: Essays on The 














现 了 数学 定律 可 以 用 


究 人 员 〈E 代表 
由 友 ， 我 也 感到 很 矣 





























， 例 如 ， 数 据 库 管 











里 ， 而 在 以 前 这 些 都 是 做 不 











数据 库 系 统 与 程序 系统 





区 别 ， 但 是 也 有 


些 相似 性 。 事 实 J 




















FE， 通常 不 认为 一 个 











《更 看 











切 地 说 ， 是 一 种 特例 )。 图 








N, 


RRAY 


'The 
区 














SUM INT 


1 . 





1.3 给 出 了 代码 片 








目的 是 要 计算 一 维 数 组 A 中 整 型 数据 的 和 ， 并 将 
(该 片段 采用 一 种 假设 的 语言 来 表示 ， 但 该 语言 




















有 自 解析 性 














EGER 
OF INTEGE 











[1..N] 











Sum is '! 


3 代码 片段 


| | SUM 


a 




















显示 在 终端 上 








)。 














和 述 ( 在 本 书 中 我 采用 























Third Manifesto and Related Topics (Trafford, 2010)， 也 可 以 参见 网 页 : www.thethirdmanifesto.com。 


1.4 数据 库 系统 与 程序 系统 1 


相关 说 明 如 下 。 
语句 : 整个 代码 由 9 条 语句 组 成 。 在 程序 设计 语言 中 ， 一 条 语句 〈statement) 
就 是 一 个 指令 ， 它 可 以 引发 一 些 动作 ， 比 如 ， 定 义 或 修改 一 个 变量 、 改 变 
控制 流 等 。 通 过 观察 你 会 发 现 语句 与 表达 式 之 间 的 迪 辑 差异 ， 表达 式 就 是 
由 一 个 值 构成 的 (可 以 认为 它 是 计算 或 决定 值 的 一 种 规则 )。 例如 , 在 图 1.3 


口 










































































中 ,“I=It1” 是 一 条 语句 〔 即 赋值 语句 )， 而 It1 是 一 个 表达 式 。 注 意 ， 在 整 











本 书 中 ， 我 都 采用 通用 的 语法 来 表示 ， 即 语句 以 分 号 结束 ， 








而 表达 式 不 用 。 





类 型 : 类 型 (type) 就 是 一 组 值 的 集合 ， 即 特定 类 型 的 所 有 合法 值 的 集合 。 
任何 一 个 值 或 者 变量 都 要 属于 某 种 类 型 '。 1.3 所 示 的 代码 片段 涉及 3 
种 类 型 : INTEGER〔( 即 所 有 整数 的 集合 )、ARRAYI[1..N] OF INTEGER 
































《 即 下 限 为 1、 上 限 为 N 的 一 维 整 型 数组 )、CHAR (所 有 字符 的 集合 )。 注 

















意 ， 就 像 我 们 一 会 儿 将 要 看 到 的 (看 下 面 将 要 讨论 的 比较 运算 符 )， 它 也 
涉及 了 BOOLEAN, 即 所 有 逻辑 值 的 集合 .当然 , 它 只 有 2 种 取 值 , 即 TRUE 









































和 FALSE 。 


























变量 : 变量 (variable) 就 是 所 有 值 的 容器 〈 通 常 不 同 的 时 候 会 有 不 同 的 值 )。 






































图 1.3 所 示 的 代码 片段 涉及 了 4 个 变量 ， 即 I、N、SUM、A。 给 定 的 变量 























的 当前 值 ( 指 的 是 在 特定 的 时 间 ， 这 个 变量 所 包含 的 值 ) 是 可 以 用 一 种 而 
































且 只 能 用 一 种 方法 来 改变 ， 即 执行 一 条 赋值 语句 ， 在 该 语句 中 把 变量 作为 
赋值 对 象 。 事实 上 ， 变 量 都 是 可 以 被 赋值 的 ， 而 值 也 都 可 以 被 赋予 变量 。 





山 | 








赋值 : 赋值 (assignment)〔 比 如 图 1.3 中 的 :=) 就 是 一 个 运算 符 ， 它 可 以 
修改 一 个 变量 的 值 。 也 就 是 说 ， 给 变量 赋予 一 个 值 ， 这 个 值 也 许 和 以 前 的 





























值 不 相同 。 图 1.3 所 示 的 代码 片段 包含 了 4 条 赋值 语句 。 








竺 号 : 符号 〈literal) 是 一 种 “ 自 定义 符号 ”。 例如， 符号 











可 以 表示 某 个 值 ， 















































而 这 个 值 的 类 型 就 由 讨论 的 符号 来 决定 。 图 1.3 所 示 的 代码 片段 中 有 3 种 


符号 ， 即 0、1 和 “The sum is”( 前 两 个 都 是 整 型 ， 第 三 个 是 字符 型 )。 





























值 : 值 (value) 指 的 是 单独 的 一 个 常量 。 它 通常 由 表达 式 来 声明 ， 也 可 以 



































被 赋予 一 个 变量 。 注意 在 特定 情况 下 , 符号 和 变量 引用 都 是 表达 式 , 因此 ， 
它们 都 可 以 用 来 声明 值 。 每 一 个 值 也 表达 一 种 特定 的 数据 类 型 。 
































一 人 











只 读 运算 符 : 只 读 运 算 符 (read-only operator) 就 是 一 种 运算 符 ， 比 如 “+”， 
它 可 以 修改 旧 值 ， 得 到 新 值 。 例 如 表达 式 2+3， 就 从 原来 的 值 2 和 3 得 到 
了 一 个 新 值 5。 但 要 特别 注意 的 是 ， 当 它 被 借用 时 ， 只 是 返回 一 个 结果 而 




































































1 事实 上 ， 
注意 























是 属于 一 种 特定 数据 类 型 ， 除 非 有 类 型 继承 关系 ， 但 在 本 书 中 是 不 存在 类 型 继承 关系 的 。 

















类 型 是 不 能 相交 的 《至 少 我 们 所 关心 的 就 是 )， 即 没有 一 个 值 会 同时 属 了 


F 2 个 或 者 多 个 类 型 。 
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不 修改 任何 事物 (尤其 是 不 修改 它 的 操作 数 ')。 但 还 要 引起 注意 的 是 , 我 


在 
种 只 





(read 


能 使 


都 采 月 
RANDOM 这 个 只 
比较 运算 符 : 比较 i 





符 ， 当 被 借用 时 ， 返 回 





运算 符 也 是 只 读 运 算 符 ， 
最 后 要 说 明 的 是 ， 之 所 以 详 述 这 些 大 家 已 经 相 
























































了 像 0 这 档 
了 一 些 惯常 使 用 的 标识 符 来 声明 。 例如 ,许多 程序 设计 语言 都 支持 








Pe 





读 运 








前 所 说 的 那些 就 是 一 种 计算 值 的 规则 , 但 表达 式 可 
读 运 算 符 的 借用 。 事 实 上 ， 术 语 表达 式 (expression) 和 只 读 运 
-only operator) 借用 是 可 以 互 换 的 。 最 后 要 注意 的 是 ， 只 读 运 算 
fF 的 专门 运算 符 来 声明 。 事 实 上 ， 大 多 数 这 样 的 i 























ea 





es 





















































符 来 产生 一 些 随机 数 。 
运算 符 (comparison operator) 就 是 类 似 于 “<” 的 运算 
一 个 真 值 (TRUE 或 者 FALSE)。 事 实 上 ， 这 样 的 
日 它 们 的 返回 值 类 型 为 BOOLEAN。 























出 现 的 概念 都 是 和 数据 库 直接 相关 的 ， 这 些 在 接 下 来 的 内 容 中 将 会 看 到 。 
更 多 的 类 型 





首先 ， 对 于 类 型 的 定义 ， 我 尤其 




















要 多 i 








一 些 。 图 




















以 等 价 地 去 表示 


符 


符 不 
运算 符 


当 熟 悉 的 知识 ， 是 因为 所 有 以 前 


1.3 所 示 的 代码 片段 不 能 解释 


这 一 点 ， 但 是 通常 情况 下 ， 类 型 或 者 由 系统 定义 , 或 者 由 用 户 定义 ， 它 们 也 可 以 任 


意 组 合 。 例 如 ， 在 一 些 几何 应 
RECTANGLE、CIRCLE 等 。 然 而 ， 对 村 
的 用 户 是 相对 而 言 的 ) 来 说 ， 这 些 定义 类 型 的 用 户 更 
在 这 本 书后 面 我 所 提供 
定义 的 类 型 


分 情况 下 只 能 


其 次 ， 我 曾经 说 过 ， 每 个 值 都 是 属于 某 种 类 型 的 。 
只 读 运算 符 或 者 每 个 表达 式 〈 尤 


赋予 每 个 运算 





























AAA 


符 、 每 个 
] )， 这 些 运算 符 也 是 属于 某 种 类 型 的 ， 
定 会 声明 某 些 值 。 

















的 作 





| 子 

















二 





se 









































是 INTEGER。 





1 这 样 就 会 出 现 一 个 很 明显 的 问题 ， 即 是 否 还 





是 肯定 的 。 修 改 运 算 符 就 是 在 被 借 

















给 定 的 修改 运 


和 符 的 借 


元 /AR 


体 说 明 如 下 。 
就 变量 、 参 数 和 只 读 运算 符 来 说 ， 当 定义 问题 9 
类 型 就 要 被 说 明 。 例 如 ， 看 医 
就 表达 式 而 言 ， 当 要 计算 问题 中 的 表达 式 时 ， 它 的 类 型 只 是 返回 结果 的 类 
型 。 例 如 ， 表 达 式 2+3 的 类 型 为 INTEGER， 这 是 



































多 


















































j 时 不 返 世 





1.3 


类似 于 这 样 







































































其 是 每 个 符号 逢 


因为 有 这 些 结构 存在 ， 所 以 使 用 它们 时 肯 





中 ， 用 户 也 许 会 定义 如 下 类 型 : POINT、LINE、 
F 只 是 使 用 它们 的 用 户 ( 与 实际 定义 它们 
能 准确 地 去 认识 系统 。 所 以 ， 
P, 为 了 尽量 减少 失去 或 不 失去 通用 性 , 我 限定 大 音 
J 有 INTEGER 和 CHAR， 但 不 完全 是 这 样 。 


它 要 把 每 个 变量 、 每 个 参数 
































然而 ， 我 们 将 会 ; 























在 后 面 看 到 ， 
， 赋 值 就 是 我 们 需要 的 修改 运算 符 。 


[每 个 变量 引 





FP 的 一 些 结构 时 ， 问 题 中 的 
FP 的 变量 定义 ， 即 VAR 语句 。 


因为 该 表达 式 的 结果 5 


特性 的 运算 符 ， 但 它 是 不 是 只 读 的 呢 ? 答案 当然 


值 ， 但 是 修改 一 些 变量 。 
j 在 功能 上 都 等 价 于 一 个 赋值 操作 。 从 尿 辑 上 





任何 





全 一 





朱 二 
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点 ， 也 是 最 后 一 点 ， 理 解 与 给 定 类 型 T 的 关系 ， 这 一 点 很 重要 。 对 于 类 型 








T， 定 义 了 一 组 操作 符 的 集合 ， 要 操作 类 型 T 中 的 值 和 变量 (因为 没有 操作 符 的 类 
型 是 无 用 的 )。 例 如 ， 对 于 类 型 INTEGER 而 言 ， 为 简单 起 见 ， 我 只 定义 系统 ， 由 























代理 负责 定义 类 型 。 换 名 话说 ， 该 系统 必须 定义 如 下 内 容 。 








理解 给 定 类 型 Tj 
算 符 的 语法 
赋值 : 把 值 v 赋值 给 变量 V 之 后 ， 比 较 大 vy 就 是 TRUE。 注意， 这 个 条 
件 有 时 也 称 为 赋值 



































为 了 给 整 型 赋值 或 者 比较 整 型 ， 必 须 定 义 运 算 符 “:=”“=”“<” 等 。 
为 了 在 整 型 上 执行 算术 运算 ， 必 须 定义 运算 符 “+”“*” 等 。 

为 了 把 整 型 转化 为 字符 串 ， 也 要 定义 CAST 运算 符 。 

不 要 定义 “| (连接 运算 符 )”“SUBSTR ( 求 子 串 )” 这 样 的 运算 符 (至 少 
在 我 给 的 例子 中 没有 使 用 ), 因为 这 些 运算 符 对 于 整 型 数据 操作 没有 意义 。 






























































FP 必 须 包 含 赋值 和 等 式 子 、 比 较 是 非常 重要 的 ,而且 ， 这 些 运 
必须 要 满足 下 述 条 件 。 





iT 





























百 











= 








小 "0 





等 式 : 如 果 v 和 








须要 具有 相同 的 类 型 )。 注 意 下 面 这 条 重要 推论 : 如 果 存 在 运算 符 Op， 且 











v2 具有 相同 的 值 ， 则 v1=v2 就 是 TRUE (提示 : 它们 必 









































Op (v1) 关 Op (v2)， 那 么 v1=v2 就 是 FALSE。 
































注意 : 对 于 “:=” 和 “=” 这 两 个 运算 符 ， 它 们 的 等 价 性 是 非常 重要 的 。 因 为 

















我 们 就 不 能 讨论 值 vy 和 值 的 集合 S， 不 管 v 是 否 出 现在 S 中 例如 ， 判 断 




















没有 它 ， 
vy 是 否 是 5 的 元 素 )。 
最 后 ， 我 再 重复 一 下 ， 



































之 所 以 详细 讨论 我 们 已 经 相当 熟悉 的 知识 ， 是 因为 所 有 














的 定义 都 是 直接 与 数据 库 相 关 的 ， 这 一 点 在 下 面 的 章节 中 将 会 看 到 。 


1.5 


现在 到 了 该 做 练习 的 时 候 了 。 当 然 ， 在 本 书 中 的 第 1 章 就 进行 查找 练习 是 不 可 
能 的 ， 下 面 大 多 数 是 复习 题 。 尽 管 如 此 ， 我 还 是 建议 你 们 尽力 独自 去 回答 问题 ， 而 





练习 











不 要 去 看 后 面 给 出 的 答案 。 


足够 的 知识 让 你 们 去 了 


1.1 


TI 















































注意 ， 前 两 个 练习 似乎 有 些 不 公平 ， 因 为 我 还 没有 提供 




















确 回 答 它们 ,但 是 我 认为 你 们 应 该 了 解 一 下 ， 它 们 并 不 难 。 

















下 面 的 TutorialD 表达 式 的 含义 是 什么 ? 
a.P WHERE WEIGHT < 12.5 
b.P { PNO , COLOR , CITY } 




















写 出 TutorialD 


下 面 语句 的 功能 。 





a. DELETE S WHERE STATUS = 10 }) 





























b. UPDATE S WH 


ERE STATUS > 10 : { STATUS := STATUS + 5 };}; 
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1.3 
1.4 


1.5 
1.6 


什么 是 数据 库 ? 什么 是 DBMS? 
解释 下 列 术语 : (a) 安全 控制 ; (b) 完整 性 控 
复 控制 。 

什么 是 SQL? 什么 是 Tutorial D ? 

用 自己 的 话 解释 下 列 概念 。 

口 值 
口 变量 
口 ”符号 
口 ”赋值 
口 ”比较 

口 ”只 读 运 算 符 
修改 运算 符 








制 ; 《 





er 



































c) 并 发 控制 ; (qd) 恢 








(不 参考 本 章 内 容 的 前 提 下 独立 完成 ) 供应 商 和 零 人 





F 表 数据 库 中 包含 哪些 





表 ? 都 有 哪些 列 ? 注意 : 该 练习 的 重点 是 让 你 尽 可 能 熟悉 数据 库 的 结构 ， 



























































至 少 是 采用 通用 的 术语 来 理解 ， 但 不 需要 去 记 住 数据 库 








i 





P 存 储 的 数值 。 





a. 找 出 重量 小 于 12.5 的 零件 。 这 个 例子 中 用 到 了 关系 限定 运算 符 。b. 给 




















出 每 个 零件 的 编号 、 颜 色 和 所 在 城市 。 这 个 练习 确实 有 些 不 公平 ， 但 也 
许 你 能 猜 出 答案 。 正 如 限定 运算 可 以 选 出 特定 的 列 一 样 ， 该 例子 中 给 出 
的 投影 操作 也 可 以 选择 出 特定 的 列 。 我 们 将 在 第 4 章 给 出 进一步 的 解释 。 






































a. 删除 所 有 状态 等 于 10 的 供应 商 。b. 把 状态 大 于 10 的 供应 商 的 状态 


















































你 有 一 点 儿 糊 涂 了 








~ 























值 都 增加 5。 顺便 说 一 下 ， 注 意 该 例子 中 关键 词 UPDATE 的 用 法 。 也 许 
在 数据 库 领 域 中 ， 使 用 大 写 形式 如 UPDATE 来 指 代 





改 值 操作 的 运算 符 已 经 成 为 一 个 标准 (与 之 对 应 ，DELETE 代表 删除 已 
存在 的 数据 ，INSERT 代表 插入 新 数据 )， 小 写 形式 update 代表 运算 符 集 

















合 INSERT、DELETE、UPDATE。 因 此 ,在 本 书 中 ， 











当 用 运算 符 UPDATE 





时 ， 我 将 采用 大 写 形式 。 对 于 INSERT、DELETE， 则 不 会 产生 歧义 ， 








如 果 使 用 大 写 形 式 ， 有 时 会 觉得 多 余 ， 特 别 是 在 它们 只 是 作为 一 个 修饰 





























语 存在 的 时 候 ， 例 如 “INSERT 语句 ”( 是 否 可 以 使 用 “insert 语 J ”)。 

















因此 ， 我 决定 在 本 书 中 这 两 种 形式 都 采用 ， 但 要 











其 具体 的 含义 。 


一 





民 据 上 下 文 环境 来 区 分 


1.7 








数据 库 就 是 采用 电子 化 的 形式 存储 数据 的 仓库 。 
它 管理 数据 库 并 可 以 访问 这 些 数据 库 。 





























DBMS 是 一 个 软件 系统 ， 








安全 控制 就 是 保护 数据 库 不 受到 非法 操作 ， 完 整 性 控制 就 是 保护 数据 库 



































接受 经 过 认证 的 、 有 效 的 操作 ， 并 发 控制 是 保护 用 户 的 操作 ， 使 其 不 产 





生 相 互 影 响 ， 恢 复 控制 是 保证 数据 不 丢失 。 











SQL 是 一 种 可 以 和 关系 数据 库 进 行 交 互 操作 的 标准 化 语言 。 目 前 ， 市 场 上 的 
主流 数据 库 都 支持 此 种 语言 。Tutorial D 是 一 种 专门 为 解释 关系 型 概念 而 设计 
的 语言 ， 原 型 实现 确实 是 存在 的 〈 可 以 参见 网 站 wwwthethirdqmanifesto.com)， 
但 是 ， 在 写本 书 的 时 候 ， 还 没有 形成 商业 性 的 产品 。 












































类 型 就 是 一 组 值 的 集合 。 一 个 值 就 是 一 个 独立 的 常量 ， 例 如 ， 整 数 3 是 

















不 能 改变 的 。 变 量 就 是 一 些 值 的 容器 ， 它 可 以 被 改变 。 例 如 ， 它 的 当前 

















值 是 可 以 被 另 一 个 值 所 蔡 代 的 。 一 个 符号 就 是 











个 自我 定义 的 一 种 标志 ， 











用 来 表示 一 个 值 。 例如， 数值 3。 赋 值 是 一 种 运算 符 ， 它 可 以 改变 一 个 变 















































量 的 值 。 比 较 就 是 一 种 只 读 运算 符 ， 它 可 以 在 












































DELETE、UPDATE 都 是 关系 型 的 更 新 运算 符 ， 
值 来 定义 。 进 一 步 的 解释 说 明 可 以 参见 第 2 章 。 
参考 图 1.1。 


两 个 值 之 间 进 行 对 比 ， 然 


后 返回 一 个 布尔 值 。 更 新 运算 符 可 以 修改 某 些 变量 的 值 ， 换 名 话说 ， 它 
也 是 一 种 赋值 。 注 意 ， 在 练习 1.2 的 答案 中 提 到 的 运算 符 INSERT、 











因而 都 采用 关系 型 的 赋 





第 2 章 


关系 和 关系 变量 


没有 什么 可 以 像 关系 一 样 去 处 理 问 题 。 


一 一 写 给 William Makepeace Thackeray 的 歉 语 
Vanity Fair (1847~1848 ) 








在 这 一 章 中 ， 我 想 向 大 家 清楚 地 解释 在 第 1 章 中 提 到 的 数据 “看 上 去 是 关 
系 型 的 ”的 真正 含义 。 换 句 话 说， 我 想 要 确切 地 解释 什么 是 关系 。 首 先 ， 我 需 
要 向 您 展示 一 些 兽 在 前 面 音节 讲 过 的 事情 ， 即 (a) 关系 模型 是 最 精确 的 ;(b) 
这 种 精确 需要 精确 的 或 规范 化 的 术语 ;〈c) 这 种 规范 化 的 术语 让 人 感觉 有 点 长 
惧 《〈 它 真 的 会 成 为 理解 过 程 中 的 一 个 障碍 )。 但 是 这 些 术 语 中 提 到 的 概念 却 是 相 
当 直 观 的 。 在 你 和 这 些 规范 化 斗争 的 时 候 ， 我 希望 你 已 经 做 好 准备 去 付出 必要 
















































































































































































的 努力 。 


2.1 关系 











我 们 再 重 温 一 下 供应 商 和 零件 数据 库 (如 图 2.1 所 示 ， 它 和 图 1.1 所 示 是 一 样 









































的 )， 从 关系 型 的 视角 来 看 ， 以 前 在 数据 库 中 被 称 作 的 “文件 ”或 “ 表 ” 其 实 都 是 

















关系 。 现 在 ， 关 系 就 是 一 个 数学 上 的 概念 ， 它 有 一 个 非常 精确 的 数学 定义 ， 

















在 本 章 


结束 时 我 将 会 给 出 这 个 定义 , 现在 我 们 知道 关系 被 描述 成 表 的 形式 就 足够 了 。 每 一 


























种 关系 都 由 标题 和 内 容 组 成 ， 即 : 

口 “ 标题 是 由 一 些 属 性 (attributes) 构成 (在 表格 中 用 列表 示 ); 

口 “ 内 容 是 由 一 些 元 组 〈tuples) 构成 (在 表格 中 用 行 表 示 )。 注 意 : 
时 也 被 称 作 偶 对 。 
























































元 组 有 
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Paris 
London 


应 商 表 和 零件 表 数 据 库 一 一 样本 数据 



































下 面 我 们 就 仔细 看 看 什么 是 属性 和 元 组 。 


2.1.1 属性 


属性 由 名 字 和 相应 的 类 型 组 成 (更 规范 地 说 , 属性 是 由 属性 名 和 类 型 名 组 成 的 
偶 对 )。 例如 ， 供应 商 关 系 有 一 个 属性 ， 它 的 名 字 为 STATUS， 它 的 类 型 名 为 
INTEGER， 这 就 意味 着 属性 的 合法 值 都 是 INTEGER， 而 且 只 能 是 INTEGER 。 
在 这 个 定义 中 我 要 强调 下 面 两 点 。 
口 “ 这 里 我 们 可 以 把 属性 的 类 型 (type) 也 称 为 域 (domain )， 即 类 型 和 域 指 的 
是 同一 件 事情 〈 在 早期 写 的 关系 型 的 著作 中 都 称 之 为 域 ， 最 近 都 用 类 型 奉 
代 了 ， 所 以 在 本 书 中 我 坚持 使 用 类 型 )。 
口 图 2.1 中 给 出 的 关系 的 表格 形式 并 没有 给 出 属性 的 类 型 。 例 如 ， 属 性 
STATUS 的 类 型 为 INTEGER, 但 在 图 中 并 没有 指示 出 来 。 但 是 不 要 忘记 ， 
从 概念 上 来 说 它 是 存在 的 。 
供应 商 关 系 中 的 属性 如 下 所 示 : 











































































































点 












































SNO : SNO 
SNAME : NAME 
STATUS : INTEGER 
CITY : CHAR 








上 面 给 出 的 每 一 对 中 的 第 一 个 名 字 是 属性 名 , 第 二 个 是 相应 的 类 型 名 , 在 此 例 
中 我 假设 类 型 SNO〔 指 的 是 供应 商 编 号 ) 和 SNAME ( 指 的 是 供应 商 的 名 字 ) 是 用 















































户 已 经 定义 的 类 型 ， 类 型 INTEGER (所 有 合法 的 整 型 值 的 集合 ) 和 CHAR (所 有 
合法 的 字符 串 的 集合 ) 是 系统 定义 的 。 但 是 ， 现 在 我 要 提醒 您 的 是 ， 在 第 1 章 中 








到 这 个 例子 时 , 用户 定 义 的 类 型 


它们 的 用 户 来 说 是 这 样 ， 但 对 于 真正 定义 它们 的 用 户 来 说 不 是 这 样 的 )。 
还 要 进一步 简化 这 个 例子 , 假设 属性 SNO 和 SNAME 者 








这 一 点 上 来 说 ,我 i 

(这 个 类 型 是 系统 
SNO : CHAR 
SNAME : CHAR 
STATUS : INTEGER 
CLLY :CHAR 


人 是 不 重要 的 (对 于 关系 型 数据 库 来 说 也 不 重要 )。 
因此 ， 供 应 商 关 系 的 标题 就 是 一 组 集合 ， 
{ SNO CHAR, SNAME CHAR, STATUS 
这 就 是 Tutorial D 的 标记 方法 。 
门 使 用 一 个 或 者 多 个 空格 代替 冒号 来 分 隔 属 性 名 和 类 型 名 ; 使 
有 0 个 或 多 个 空格 ) 来 分 隔 每 个 属性 ;使 用 大 括号 
封装 起 来 。 在 论文 中 对 于 集合 的 常用 表示 就 是 采 


我 
带 
对 





事实 上 ,在 本 

















采用 去 号 分 隔 的 。 
语法 说 明 : 前 面 的 这 个 段落 包含 了 本 书 中 第 一 次 提 到 的 有 用 的 术语 ( commalist )， 
而 且 后 面 还 要 多 次 使 用 。 它 的 定义 如 下 : 假设 xyz 表示 一 种 语法 结构 ( 例如: 表示 属 
性 ) 那么 术语 xyz commalist 就 代表 0 个 或 多 个 xyz 的 序列 ， 该 序列 中 的 每 一 对 相 邻 
Xz 的 都 用 去 号 分 隔 ， 在 过 号 之 前 或 之 后 可 以 添加 一 个 或 多 个 空格 。 











给 定 标题 中 属性 的 个 数 称 为 度 (degree)， 攻 
据 库 











2.1 关系 
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提 

















是 假设 被 看 作 是 系统 已 经 定义 好 的 (至 少 对 于 使 
所 以 ， 














已 经 定义 的 ) 类 型 的 ， 即 : 























从 


是 CHAR 


中 对 于 用 户 定 义 的 类 型 我 没有 解释 太 多 。 这 种 简化 可 以 允许 我 
忽略 很 多 细节 ， 而 这 些 细节 对 于 定义 类 型 的 人 来 说 是 很 重要 的 ,但 对 于 使 用 类 型 



































即 : 


INTEGER, CITY CHAR } 











就 像 你 看 到 的 天 






































逗号 (后 面 可 
(2 2 和 66 2 来 把 这 些 属 
j 大 括号 来 封装 元 素 ， 而 元 素 


















































此 ， 我 们 可 以 把 供应 商 和 零件 





n=2， 就 称 为 二 元 关系 ; 如 果 n=3， 就 称 为 三 元 关系 ; 以 此 类 推 。 





独 标识 
时 ， 通 常用 属性 名 的 集合 来 代替 


有 





























是 属性 名 和 类 型 名 的 偶 对 。 然 而 ， 在 非 正式 的 场合 中 , 我 
性 ， 比 如 说 STATUS 属性 (位 于 供应 商 关 系 中 ) 

















最 后 一 点 要 说 明 的 是 ， 就 像 我 们 前 面 看 到 的 那样 ， 一 个 属性 一 经 定义 ， 就 必 











P 样 ， 在 Tutorial D 的 标题 中 


的 


以 
性 


是 


数 


FP 供 应 商 关 系 的 度 称 作 为 4、 零件 关系 的 度 为 5、 供 应 关系 的 度 为 3。 注 意 : 
如 有 果 关 系 7 的 度 为 n， 那 我 们 就 称 它 为 n 元 的 。 如 果 n=1， 则 称 为 一 元 关系 ; 如 果 


须 











门 通常 都 是 以 属性 名 来 
。 同 样 ， 我 们 在 表示 标 














题 





、 























属性 名 和 类 型 名 的 偶 对 ， 因 此 供应 商 关 系 就 可 以 


示 为 {SNO，SNAME，STATUS，CITY}。 这 种 简化 或 者 简写 可 以 节省 很 多 多 余 


话 。 而 且 ， 这 也 








是 符合 语法 的 ， 




















因为 还 有 另 一 条 规则 〈 在 这 之 前 没有 提 到 过 ， 但 











表 
的 


是 
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通常 都 是 这 样 怕 


E 解 的 )， 即 在 某 种 程度 

















EF， 在 给 定 的 标题 中 ， 不 允许 两 个 不 同 的 属 





性 使 用 相同 的 属性 名 。 


2.1.2 元 组 
给 定 关 系 中 的 每 一 个 元 组 都 要 对 应 于 该 关系 中 的 标题 , 这 样 每 个 元 组 就 会 包含 








一 个 可 用 类 型 数值 ， 对 了 


















































每 个 属性 都 是 如 此 。 例 如 ， 供 应 商 关系 的 主体 就 是 元 组 集 























合 ， 即 供应 商 S1、S2、S3、S4 和 S$， 这 个 五 元 组 中 的 每 个 元 素 都 包含 一 个 值 ， 这 
些 值 对 应 于 属性 SNO、SNAME、STATUS 和 CITY。 而 且 这 些 值 都 是 来 自 于 可 以 








使 用 的 类 型 中 的 值 ， 


























可 以 采用 更 简单 、 更 准 























相关 的 标题 ， 这 是 






































分 别 为 CHAR、CHAR、INTEGER 和 CHAR。 注 意 : 其 实 还 
E 确 的 一 种 方式 表示 ， 即 把 这 些 元 组 中 的 每 个 成 员 都 赋予 一 个 














因为 元 组 实际 上 就 是 有 标题 的 ， 就 像 关 系 中 定义 的 那样 。 








给 定 关 系 中 元 组 的 数量 叫做 关系 的 基数 (cardinality )， 该 定义 既 适 合 于 给 定 的 





数据 库 ， 也 适合 于 该 数据 库 中 的 每 一 个 关系 “。 因 而 ， 我 们 可 以 说 图 2.1 给 出 的 供 
供应 商 关 系 的 基数 为 5、 零 件 关系 的 基数 为 6、 供 应 关系 的 基 





应 商 和 零件 数据 库 




































































数 为 12。 注 意 : 如 果 基 数 为 0， 则 该 关系 就 是 空 的 。 一 个 空 的 关系 就 像 是 不 包含 任 
何 记录 的 文件 一 样 。 











因此 ， 我 说 偶尔 也 会 发 9 








E 关 系 中 不 含有 任何 元 组 的 现象 。 它 包含 一 个 定义 体 ， 





反 过 来 定义 体 中 也 包含 元 组 。 但 实际 上 我 们 通常 讨论 的 关系 中 都 含有 元 组 。 
2.1.3 关系 的 特点 


关系 和 元 组 我 们 前 























讨论 到 这 里 ， 现 在 准备 讨论 关系 本 身 。 我 想 要 说 的 最 重要 的 














一 点 是 ， 关 系 是 非常 精确 的 、 被 规范 定义 的 ， 因 而 ， 它 们 享有 大 量 的 规范 的 特点 ， 














无 论 从 理论 上 还 是 从 实际 上 来 说 ， 这 些 特点 都 是 相当 重要 的 。 注意; 就 像 我 在 别 的 




















书 中 写 到 的 那样 (例如 : SOL and Relational Theory 一 书 )， 它 让 我 相信 理论 是 可 行 
的 ! 从 其 自身 来 看 ， 关 系 理论 的 目的 不 仅仅 只 是 作为 一 种 理论 ， 而 且 ， 该 理论 允许 


我 们 建立 100% 


中 ， 离 开 这 些 基础 





















































可 行 的 系统 。 这 就 是 我 非常 相信 它 的 原因 ， 特 别 是 在 关系 型 的 环境 
理论 就 是 一 个 天 大 的 错误 。 所 谓 的 “关系 型 ”系统 至 少 是 有 一 点 
吸引 力 的， 但 实际 上 ， 从 这 一 点 上 来 看 ， 他 们 已 经 偏离 了 基础 理论 。 












































尽管 如 此 ， 还 是 要 讨论 关系 的 4 个 特点 ， 我 先 列 出 它们 ， 然 后 再 一 一 进行 





解释 。 











口 “ 关 系 中 不 包含 重复 的 元 组 。 
口 ”每 个 关系 中 的 元 素 是 无 序 的 ， 从 上 到 下 进行 排列 。 























1 参见 第 3 章 的 脚注 ， 关 于 “每 一 个 关系 ”的 含义 的 解释 。 





每 个 关系 








AAA 


第 一 范 








的 属性 是 无 序 的 ， 从 左 到 右 进 行 排列 。 
关系 总 是 规范 化 的 (例如 ， 
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式 的 缩写 为 INF )。 





关系 中 不 包含 重复 元 组 。 这 个 特点 说 明了 一 个 多 辑 上 的 事实 ， 即 关系 被 定义 为 
民 合 ， 而 从 数学 上 来 说 ， 集 合 中 不 包含 重复 的 元 素 。 


每 个 关系 中 的 元 素 是 无 序 的 , 从 上 到 下 排列 。 这 个 特点 也 是 一 个 迪 辑 上 的 














ee 


即 关系 


企 储 公 
| 








但 在 数学 上 规定 集合 中 





全 





{ca 节 是 等 价 的 )。 当 然 ， 当 我 们 把 关系 表示 成 一 个 表格 
旧 是 这 个 次 序 是 任意 的 , 你 可 以 不 考虑 它 。 


应 商 关系 表 ， 表 中 的 行 是 没有 任何 次 序 的 。 我 们 可 以 先 描 


是 按照 从 上 到 


例如 ， 
述 S3， 


图 2.1 
然后 














格 时 《例如 ， 


序 是 任意 的 ， 你 同样 可 以 忽略 它 。 例 如 图 2.1 中 的 供应 商 关 系 ， 
次 序 排列 每 一 列 ， 即 STATUS、SNAME、CITY、SNO， 这 和 


种 关系 。 因 











的 位 置 -。 

















如 ， 在 属性 中 不 会 有 “下 一 个 ”的 定义 )。 关 系 的 属 怕 
关系 总 是 规范 化 的 (例如 ， 第 














这 


长- ， 














事实 ， 


的 元 素 是 没有 次 序 的 (例如 , {a,b,c} 和 

















下 的 次 序 来 排列 这 些 行 的 ， 








时 





例如， 在 纸 上 )， 我 们 
































中 描述 的 供 
述 S1， 之 后 可 以 依次 描述 S5、S 























的 说 法 ， 也 不 会 说 “下 一 个 元 组 ” 换 名 话说 ， 
“下 一 个 ”的 说 法 。( 注 意 ， 偶 尔 我 们 规定 了 这 检 
的 、 附 加 的 运算 ， 例 如 ,“ 检 索 第 n 个 元 组 ”“ 捐 
这 儿 移 到 那儿 ”等 等 。 在 第 7 章 中 我 们 ; 

每 个 关系 中 的 属性 是 无 序 的 ， 
从 左 到 石 排列 ， 这 是 









































因为 标题 也 被 定义 为 集合 。 








4、S2， 这 和 


因此 要 注意 ， 在 关系 中 没有 “第 1 个 元 组 和 “第 个 元 组 ”、“ 








图 2.1 表示 的 是 同一 个 





第 87 个 元 组 ” 














这 些 元 组 没有 位 置 的 定义 ， 也 没有 
的 次 序 ， 是 因为 我 们 需要 一 些 特定 
入 一 个 新 元 组 和 “把 这 个 元 组 从 
各 会 特别 介绍 这 个 问题 。) 

从 左 到 右 排列 。 同 样 , 关系 中 
我 们 把 关系 表示 成 一 个 表 











的 属性 也 是 无 序 的 ， 





在 纸 上 )， 我 们 是 按照 从 左 到 右 的 次 序 来 排列 这 些 列 的 ， 但 是 这 个 次 





























了 )。 所 以 ， 























EE 


一 个 明显 





是 按照 从 左 到 右 的 
2.1 表示 的 是 同一 











名 











而 ,不 会 有 “第 1 个 属性 和 “第 2 个 属性 和 “下 一 个 属性 ”的 说 法 〈 例 
通过 名 字 标识 ， 而 不 是 它们 





一 范式 的 缩写 为 INF)“。 在 非 正式 的 情况 下 ， 

里 所 有 语句 的 含义 都 是 在 说 ， 我 们 所 讨论 的 关系 中 的 每 一 个 元 组 都 是 与 相应 的 标 
题 一 致 的 〈 这 一 点 我 们 早已 经 知道 
规范 化 的 吗 ? 答案 是 否定 的 。“ 非 规范 化 的 关系 ”从 术语 -| 


的 问题 就 是 关系 可 以 是 非 
上 来 讲 就 是 矛盾 的 。 然 而 ， 





























表格 可 能 真 的 是 非 规范 化 的 , 这 与 关系 正好 相反 。 这 部 分 内 容 我 将 在 此 书 的 第 三 部 


分 详细 讲解 。 





1 实际 上 ， 不 需要 我 们 关心 的 
(参见 附录 C)， 并 不 像 关 


自 
2 你 可 


tr 





能 知道 ， 




















系 模型 中 定义 的 。 





正 原因 是 ， 数 学 中 定义 的 关系 是 








巴 / 




















属性 按照 次 序 从 左 到 右 的 次 序 排 列 























t 有 可 能 定义 更 好 一 级 的 范式 ， 如 第 二 范式 、 第 三 范式 等 ， 这 与 数据 库 


有 第 一 范式 ， 六 
的 设计 规则 有 关 。 在 本 书 的 第 二 部 分 我 将 会 介绍 该 内 容 。 
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2.2 关系 变量 


































































































































































































































































































































































































我 们 再 来 看 看 图 2.1， 该 图 给 出 了 3 个 关系 ， 即 在 茶 个 特定 的 时 间 数 据 库 中 已 
经 存在 了 这 些 关 系 。 但 是 如 果 换 个 不 同 的 时 间 再 来 看 看 这 个 数据 库 ， 我 们 也 许 会 看 
到 不 同 的 关系 。 换 名 话说 ， 这 些 在 图 中 标识 为 S、P、SP 的 对 象 实际 上 是 变量 ， 明 
确 地 说 是 关系 变量 。 像 所 有 的 变量 一 样 ， 它 们 在 不 同 的 时 间 会 具有 不 同 的 值 。 因 为 
按照 特性 划分 ， 它们 是 关系 变量 ， 所 以 在 任何 给 定 的 时 间 ， 它 们 的 值 也 是 关系 型 的 
数值 (如 图 2.1 所 示 ， 给 出 的 是 3 个 关系 型 的 数值 )。 

现在 ， 因 为 S、P、SP 都 是 真正 的 变量 ， 它 们 当然 也 可 以 被 修改 、 被 赋值 。( 像 
第 1 章 提 到 的 ， 变 量 可 以 被 赋值 ， 也 可 以 把 值 赋 给 变量 。 ) 例如 ， 假 设 变量 S 当前 
具有 的 值 如 图 2.1 所 示 ， 然 后 ， 假 设 我 们 执行 下 面 的 关系 型 赋值 : 

Sis. WHERE CITY FF TLONdonm': 

和 所 有 的 赋值 语句 一 样 ， 上 面 语句 的 作用 是 计算 右边 表达 式 的 值 ,然后 把 结果 
赋值 给 左边 的 目标 变量 。 所 以 ， 关 系 变量 $ 的 值 如 下 所 示 : 

S52 Jones 10 Paris 
S3 Blake 30 Paris 
Ss5 Adams 30 Athens 

换 句 话说， 供应 商 S1 和 S4 的 元 组 (二 者 的 CITY 属性 值 都 为 London) 都 被 
删除 了 。 事 实 上 ， 前 面 的 赋值 语句 与 下 面 的 DELETE 语句 是 等 价 的 : 

DELETE S WHERE CITY = 'London' ; 

因而 , 这 个 DELETE 语句 是 比 前 面 的 赋值 语句 更 友好 的 一 种 “速记 ”方法 ( 速 
记 ” 加 上 引号 ， 是 因为 它 实 际 上 要 比 所 期 望 的 缩写 长 一 些 )。 然 而 ， 这 也 没有 关系 


(不 管 修改 操作 是 被 规范 化 为 关系 型 的 赋 












































值 ， 


还 是 采 








来 表示 )， 因 为 从 概念 上 来 说 都 是 S 的 旧 值 已 经 被 新 值 完全 蔡 代 了 。 


个 元 组 ) 和 新 值 〈 
实际 上 , 现 











带 有 3 个 元 组 











) 很 明显 是 不 一 样 的 ， 


在 关系 型 的 DBMS 都 支持 作用 于 关系 变量 的 INSERT、 





UPDATE 运算 符 , 至 少 从 概念 上 来 说 , 这 些 运算 符 者 


记 方法 。 从 逻辑 上 来 说 ,在 关系 型 赋值 运算 


























它们 具有 不 同 




















只 是 特定 关系 型 由 


更 为 友好 的 以 这 种 速记 方式 


旧 值 ( 带 有 5 
的 值 。 
DELETE 和 























武 值 的 一 种 速 











FP 我 们 只 需要 修改 运算 符 








在 第 4 章 中 做 出 说 明 )。 现 在 我 来 更 多 地 展示 一 些 速记 方法 的 例子 ， 
外 一 个 DELETE 的 例子 : 


DELETE SP WHERE QTY < 150; 








(这 一 点 我 将 
第 一 个 就 是 另 
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对 于 这 个 DELETE 的 结果 , 我 将 其 作为 练习 留 给 读者 , 样本 数据 如 图 2.1 所 示 。 





下 一 个 例子 是 INSERT: 


INSERT SP 








INSERT 运算 的 结 


RELATION { TUPLE { SNO 








1S51! ， 


下 训 了 BT 本 ‘SNO 85 


果 是 把 一 个 由 2 个 元 组 组 成 的 关系 所 


1'p1' 
1'p3' 


PNO 
PNO 


7 QTY 
, QTY 








250 } ， 
4 


入 到 关系 变量 SP 中 。 





假设 这 个 变量 的 初 值 就 是 图 2.1 所 示 的 供应 关系 ， 那 么 执行 INSERT 后 ， 这 个 关系 

















的 基数 就 变 为 14， 即 12 个 已 存在 的 元 组 再 加 











最 后 一 个 例子 是 UPDATE: 





UPDATE SP WHERE SNO = 'S2' : 


仍然 假设 关系 变量 SP 的 初 值 为 医 





一 个 不 同 的 关系 ， 





的 属性 赋值 QTY := 2 * QTY 
再 强调 一 下 ， 实 际 上 现在 关系 型 的 DBMS 都 支持 作 上 月 


{ QTY := 2 


















































《要 放 在 大 括号 内 )。 




















上 2 个 新 的 元 组 。 


OT 











2.1 所 示 的 关系 ， 执 行 UPDATE 后 ， 会 得 到 
因为 供应 商 S2 的 QTY 值 翻 倍 了 。 顺便 提 一 下 ， 


要 注意 该 语句 中 














月 于 关系 变量 的 INSERT、 


DELETE 和 UPDATE 运算 符 ， 尽 管 存 在 这 个 事实 ， 但 至 少 从 概念 上 来 说 ， 这 些 运 
算 符 都 只 是 特定 关系 型 赋值 的 一 种 速记 方法 。 然 而 ， 一 定 要 注意 ， 所 有 这 些 运算 符 
的 运算 对 象 〈 包 括 关 系 型 赋值 ) 不 是 一 个 关系 值 ， 而 是 一 个 关系 变量 。 相 比 之 下 ， 











我 们 前 面 章节 中 提 到 的 限制 和 投影 这 样 的 运算 


限制 、 








第 1 意 ) 
总 结 一 下 ， 关 系 值 


























影 以 及 我 们 将 在 第 4、5 章 讨论 的 其 1 
INSERT、DELETE 和 UPDATE 是 更 新 运算 符 。 对 于 这 
























































符 是 对 关系 值 进行 操作 的 。( 当然， 


























也 运算 符 都 是 只 读 运算 符 ， 然 而 
两 类 运算 符 的 差异 ， 请 参见 


和 关系 变量 之 间 是 有 迪 辑 上 的 差异 的 。 为 此 ， 接 下 来 我 要 更 
加 详细 地 对 二 者 加 以 区 分 。 当 讨论 关系 值 时 就 使 用 关系 值 , 讨论 关系 变量 时 就 使 用 
关系 变量 ,然而 , 大 多 数 情况 , 我 也 会 把 亲 值 























(relation value) 简写 为 关系 (relation) 


(就 像 我 们 把 整 型 值 Linteger value] 简写 为 整 型 [integerj] 一 样 )。 同 时 ， 也 会 把 关 


系 变 量 (relation variable) 简写 为 relvar， 例 如 我 说 供应 商 和 零 从 














数据 库 中 包含 3 





个 relvars'。 注 意 : 术语 relvar 没 有 被 广泛 使 用 ， 但 实际 是 应 该 被 广泛 使 用 的 。 

















最 后 

















点 ， 通 常 








| R 表示 


个 关系 变量 。 就 





tl 





像 关 系 一 样 ，R 























kt 有 特定 标题 卫 





《这 是 一 个 别名 ， 共 有 特定 的 属性 和 特定 的 度 )。 定 义 及 后, 标题 H 就 是 固定 的 ( 参 























1 更 确切 地 说 ， 是 3 个 真正 的 或 者 基本 的 关系 变量 。 这 是 为 了 





























见 第 3 章 )， 被 合法 赋值 给 R 的 每 个 关系 + 必须 具有 相同 的 标题 HH。 而 目 

















分 (进一步 的 讨论 可 以 参见 第 3 章 和 第 7 前 。 




















? 在 某 








特定 时 间 罗 把 关系 二 赋值 给 R， 那 么 的 定义 体 、 元 组 、 基 数 就 是 在 时 间 上 的 了 


巴 它们 和 虚拟 的 关系 变量 或 视图 加 以 区 
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的 定义 体 、 元 组 和 基数 。 


而 标题 、 


2.3 











属性 和 度 是 不 变 的 。 





练习 





判断 下 面 的 叙述 哪个 是 正确 的 ? 
关系 (以 及 关系 变量 ) 中 的 元 组 是 无 序 的 。 
关系 《以 及 关系 变量 ) 中 的 属性 是 无 序 的 。 


2.1 
22 
2.3 
2.4 
259 
2.0 
2.7 
2.8 


请 尽量 清晰 地 给 


2.4 


练习 2.1 一 2.8 都 是 

















关系 (以 及 关系 变量 ) 不 能 有 人 


FE 何 未 命名 的 属性 。 











关系 (以 及 关系 变量 ) 不 允 廊 














关系 (以 及 关系 变量 ) 不 包含 重复 的 元 组 。 
关系 (以 及 关系 变量 ) 总 是 INF 的 。 














关系 (以 及 关系 变量 ) 本 身 是 具有 类 型 的 。 
附加 题 : 








Ar 一 一 
答案 








关系 的 定义 。 


可 以 用 本 章 的 知识 来 解释 。 练 习 2.3 也 是 毫 无 疑问 的 ， 
类 型 名 的 偶 对 定义 的 ， 从 叙述 上 来 说 ， 一 个 未 命名 的 属性 是 矛盾 的 。 现 在 就 剩 下 练 


习 2.7 和 


练习 2.8 了 。 











F 有 2 个 或 多 个 属性 








可 
N 


已 定义 的 关系 型 属性 的 类 型 可 以 是 任意 复杂 的 类 型 。 























因此 , 关系 变量 的 定义 体 、 元 组 和 基数 是 随 着 时 间 变 化 的 ， 





E 确 的 。 有 具体 说 明 如 下 : 练习 2.1、2.2、2.4、2.5 和 2.6 都 
因为 属性 就 是 采用 属性 名 和 





我 们 首先 来 看 一 下 练习 2.8,“ 关 系 〈 以 及 关系 变量 ) 本 身 是 具有 类 型 的 >。 就 像 


我 刚 说 的 ， 这 名 话 是 正确 的 。 当 然 ， 实 际 J 
1 章 中 我 们 知道 每 个 值 都 是 
有 的。 但 是 在 
因为 我 想 把 它们 放 在 第 3 章 





量 ， 从 第 





所 以 这 人 句 话 明显 就 是 
都 没有 说 
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上 关系 就 是 一 个 值 ， 而 关系 变量 就 是 一 个 变 
届 于 某 种 类 型 的 ， 每 个 变量 也 是 属于 某 种 类 型 的 ， 














章 中 对 于 关系 和 关系 变量 类 型 本 身 我 故意 什么 














来 讨论 ， 在 第 3 章 中 我 将 做 进 





步 的 解释 。 


现在 来 看 看 练习 2.7,“ 已 定义 的 关系 型 属性 的 类 型 可 以 是 任意 复杂 的 类 型 ”。 
同样 ,我 也 说 过 这 人 句 话 是 正确 的 。 我们 可 以 有 包含 值 的 、 有 共有 属性 





回 


量 , 这 些 值 可 以 和 我 1 
XML 文档 、 

















首先 ， 关 系 模型 明显 








门 想 象 的 一 样 复杂 。 例 如， 这 些 
照片 、 音 频 或 视频 记录 等 。 然 而 ， 它 也 有 许多 限制 ; 
地 禁止 了 关系 变量 ， 因 有 





























直 可 以 是 多 边 形 ， 




















据 库 中 , 意味 着 该 数据 库 中 的 关系 是 不 允许 














的 关系 和 关系 变 
可 以 是 数组 、 


比 ， 在 属性 值 为 指针 类 型 的 数 





指针 类 型 什 

















的 属性 赋值 为 元 


























组 的 。 注 意 : 前 面 提 到 的 语句 是 非常 松散 的 ， 但 是 它 也 说 明了 这 种 情况 的 
重要 性 。 至 于 为 什么 关系 模型 要 强烈 禁止 ， 有 很 多 原因 。 其 中 之 一 ，Codd 
在 他 的 书 中 The Relational Model for Database Management Version 2 
(Addison-Wesley,1990) 给 出 如 下 解释 : 
假设 所 有 用 户 都 能 理解 比较 值 的 这 个 动作 ,， 却 很 少 有 人 能 理解 指针 的 复 
杂 性 …… 即 使 恰好 有 用 户 理解 指针 的 复杂 性 ， 指 针 操 作 也 要 比 执行 比较 
的 动作 更 容易 造成 错误 。 
换 名 话说， 指针 是 很 复杂 的 ， 容 易 产 生 错误 ， 从 逻辑 上 来 说 不 是 必须 的 ，。 
例如 ， 要 查找 与 给 定 供应 商 元 组 一 致 的 供应 关系 元 组 ， 我 们 不 能 使 用 的 是 
指针 类 型 ， 但 是 我 们 可 以 通过 比较 SNO 来 替代 ， 因 为 给 定 SNO 值 的 供应 商 
元 组 可 能 存在 于 供应 关系 元 组 中 。 注 意 : 顺便 值得 一 提 的 是 ， 在 关系 模型 
中 对 于 指针 的 禁用 是 隐 含 的 ， 还 有 作为 关系 模型 的 替代 而 提出 的 各 种 方案 
也 是 禁用 指针 的 。 
口 ”第 三 点 ， 说 明 起 来 有 点 难度 ， 但 是 可 以 归结 为 一 点 就 是 ， 如 果 关 系 + 有 标 
题 了 那么 在 任何 级 别 的 从 套 中 ，7 的 属性 都 不 能 使 用 具有 相同 标题 H 的 
关系 类 型 来 定义 。 这 种 禁止 的 目的 是 排除 无 限 递归 的 可 能 性 。 对 于 关系 类 
型 的 详细 讨论 请 参见 第 3 章 。 
至 于 术语 关系 的 精确 定义 : 首先 我 们 给 出 术语 元 组 的 准确 定义 ， 如 下 : 
定义 :7T1，72，…，7Tn(n 宇 0) 表示 类 型 名 ， 与 每 个 7; 相关 的 4i 表示 不 同 
的 属性 名 ，n 个 属性 名 和 类 型 名 的 组 合 中 的 每 一 个 都 是 属性 。 与 每 个 属性 相关 的 
属性 值 记 为 万 ， 其 类 型 为 Ti; n 个 属性 和 值 的 组 合 中 的 每 一 个 都 是 一 个 元 素 。 这 
n 个 元 素 的 集合 就 定义 好 了 , t 是 一 个 元 组 值 (或 者 简称 为 元 组 ), 它 具 有 属性 47， 
A2，…，An。n 就 是 t 的 度 ， 度 为 1 的 元 组 是 一 元 的 ， 度 为 2 的 元 组 是 二 元 的 ， 
度 为 3 的 元 组 是 三 元 的 ， 以 此 类 推 ， 度 为 n 的 元 组 是 n 元 的 ， 所 有 nn 个 属性 的 集 
合 就 是 上 的 标题 。 
现在 我 们 定义 关系 : 
定义 : HH 表示 元 组 的 标题 ，{， 刀 ，…，tm〈m 宇 0) 是 不 同 的 元 组 ， 都 具有 标 
题 了 再。 具有 标题 H 和 元 组 集合 {11，t2,，…，tm} 的 组 合 就 是 关系 值 (简称 为 关系 )， 
记 为 r。 这些 元 组 的 属性 为 41，42，…，An。r 的 标题 是 机 ~ 具有 和 标题 一 样 的 
属性 《因此 也 具有 同样 的 属性 名 和 类 型 ) 和 度 。 元 组 集合 {41，t2，…, tm} 是 r 
的 定义 体 ， 值 m 是 7 的 基数 。 































































































































































































































































































































































































































































































1 理解 我 们 这 里 讨论 的 是 关于 第 1 章 中 提 到 的 “逻辑 数据 库 ”。 相 反 ， 物 理 数 据 库 几 乎 都 要 包含 指针 ， 
而 且 还 很 多 ， 但 是 这 些 指针 对 于 用 户 来 说 是 不 可 见 的 〈 用 行业 术语 解释 ， 就 是 被 封装 了 )。 




































































关系 变量 都 有 
是 解释 这 些 

















第 3 章 


码 、 外 码 和 相关 概念 


保持 呼吸 ! 这 才 是 关键 ( key )。 




















Gimli the Dwarf， 在 2002 年 的 电影 The Two Towers 
说 的 ， 所 以 J R. R. Tolkien (1954) 把 它 作为 了 一 本 书 的 名 字 


























个 码 (有 时 可 


能 是 


概念 并 探讨 它们 的 含义 。 


3.1 完整 性 约束 
每 个 数据 库 都 具有 完整 性 约束 (简称 约束 )， 这 就 意味 着 进行 修改 操作 时 要 受 








到 限制 。 下 面 给 H 





口 ”伦敦 的 人 


色 零 伯 


条 






















































































H 了 供应 商 和 零 从 


























束 的 含义 是 关系 变量 
符 ( 即 码 )。 例 如 ,在任 
码 (例如 ,SNO), 它 是 
它 与 其 他 每 一 个 元 组 的 SNO 值 都 不 相同 。 





元 组 都 通过 供应 商号 来 唯一 标识 。 








关系 变量 SP 通过 供 











的 某 些 





属性 的 组 合 可 以 充当 天 










































































同样 ， 





多 个 )， 同 时 有 些 关系 变量 还 具有 外 码 。 





数据 库 可 能 具有 的 一 些 约束 条 件 : 
口 “ 供 应 商 的 状态 值 〈status) 必须 在 1 一 100 之 间 。 
零件 重量 必须 大 于 0。 
应 商 的 状态 值 〈status) 必须 为 20。 
F 必 须 存放 在 伦敦 。 
口 ”状态 值 (status〉 小 于 20 的 供应 商 不 允许 供应 P6 号 零件 。 





现在 ， 对 于 每 个 关系 变量 都 有 一 种 特殊 的 约束 称 作 码 约束 。 不 严格 地 说 ， 该 约 
8 个 关系 变量 元 组 的 唯一 的 标识 
可 给 定 的 时 间 情 关系 变量 $ 的 每 个 元 组 都 有 一 个 供应 商号 
唯一 的 , 这 就 意味 着 在 同样 的 时 间 t, 对 于 同样 的 关系 变量 ， 



































因而 ， 在 任何 给 定 的 时 间 关 系 变量 S 的 




















关系 变量 P 都 通过 零 伯 

















应 商号 和 零 伯 











F 号 共同 来 标识 。 


号 进行 唯一 标识 ， 


28 第 3 章 码 、 外 码 和 相关 概念 









































顺便 提 一 下 ， 码 约束 本 身 就 是 完整 性 约束 。 例 如 ， 考 虑 供应 商 变量 S， 假 设 供 
应 商号 人 码 在 这 个 关系 变量 中 是 唯一 的 , 如 果 插 入 一 个 与 现 有 的 SNO 值 相同 的 元 组 ， 
或 者 把 某 个 元 组 的 SNO 值 改 为 一 个 已 经 存在 的 SNO 值 ， 则 都 会 失败 。 

我 曾经 说 过 ， 每 个 关系 变量 都 有 码 。 事 实 上 ， 这 应 该 是 显而易见 的 事实 ， 原 因 
如 下 ， 首 先 ， 在 给 定 的 时 间 关 系 变 量 的 值 就 是 一 个 关系 ; 其 次 ， 关 系 中 不 允许 包含 
重复 的 元 组 。 因 此 ， 所 有 属性 的 组 合 〈 例 如 ， 整 个 标题 ) 肯定 包含 独一无二 的 属性 。 
实际 上 整个 标题 中 只 有 真子 集会 具有 独一无二 的 属性 , 但 我 们 保证 整个 标题 肯定 会 
有 唯一 的 属性 ， 所 以 才 会 有 码 。 

集合 理论 注释 : 上 面 段 落 中 使 用 了 集合 理论 术语 真子 集 (proper subset )。 然 而 并 不 是 

所 有 人 都 熟知 这 个 术语 ， 所 以 我 岔 开 话题 来 解释 一 下 这 个 术语 ， 假 设 A 和 了 B 都 是 集合 ， 

且 A 是 B 的 子 集 ( 或 者 说 A 包含 于 B), 记 作 ACB, 其 含义 是 A 中 的 每 一 个 元 素 都 是 B 

中 的 元 素 。 相反 ，A 是 B 的 真子 集 ， 记 作 AcB， 即 A 是 B 的 子 集 ， 但 至 少 存在 一 个 元 

素 ， 它 在 B 中 ,而 不 在 A 中 。 因 此 要 记 住 ， 每 个 集合 都 是 其 自身 的 子 集 ， 但 不 是 真子 集 。 

作为 变 体 ， 上 面 的 理论 完全 适用 于 超 集 ，B 是 A 的 超 集 (或 B 包含 A)， 记 作 BcA， 

与 A 是 B 的 子 集 是 同样 的 含义 。 同样 ，B 是 A 的 真 超 集 (或 B 真 包含 A)， 记 作 BDA, 与 

A 是 B 的 真子 集 相同 。 因 此 要 记 住 ， 每 个 集合 都 是 其 自身 的 超 集 ， 但 不 是 它 自 身 的 真 超 集 。 

最 后 ， 还 有 几 个 术语 介绍 。 首 先 ， 空 集 (empty set) 是 不 包含 任何 元 素 的 集合 ， 

记 作 介 或 者 B。 空 集 是 任何 集合 的 子 集 ， 也 是 除 它 自 身 外 ， 是 任何 集合 的 真子 集 :。 其 

次 , 一 个 集合 含有 元 素 , 但 也 包括 子 集 。 对 于 该 部 分 内 容 的 进一步 讨论 可 以 参照 附录 C。 



















































































































































































3.2 码 


下 面 是 关系 术语 码 (key) 的 明确 定义 ?: 
定义 : K 是 关系 变量 R 的 标题 的 一 个 子 集 ， 当 且 仅 当 它 满足 以 下 条 件 时 , K 是 
1. 唯一 性 : 在 R 中 不 可 能 存在 与 具有 相同 值 的 元 组 。 

































































Es 














这 也 是 很 重要 的 ! 但 是 这 不 是 解释 这 个 的 地 方 。 我 只 能 说 通常 情况 在 关系 型 世界 中 ， 集 合 都 是 唯一 
的 。 如 果 恰 好 遇 到 了 衬 集 合 ， 它 也 是 没有 任何 实际 意义 的 。 详 细 解 释 可 以 参照 本 书 的 附录 B 和 C 
以 及 Hugh Darwen 的 论文 The Nullologist in Relationland, 包 全 cE Hugh 和 我 在 1989 一 1991 年 之 间 写 
的 一 本 书 Relational Database Writings 中 。 注 意 ， 术 语 非 逻辑 学 家 (nullologist) 来 自 于 希腊 语 
nullology， 意 思 是 根本 什么 也 不 研究 〈 换 名 话说 ， 就 是 研究 空 集 )。 在 SQL 中 没有 处 理 空 值 的 方法 ， 
处 理 空 值 也 是 被 强烈 反对 的 ， 我 们 在 本 书 的 第 三 部 分 也 会 看 到 。 

为 了 简化 码 的 概念 ， 有 时 也 把 码 称 为 候选 码 。 

























































































MD 








3.2 码 29 


























2. 不 可 简化 性 : K 的 任何 真子 集 都 具有 唯一 性 。 
如 果 区 包含 n 个 属性 ， 那 么 的 度 就 为 n。 
对 于 该 定义 , 需要 强调 以 下 几 点 : 第 一 , 码 是 属性 的 集合 , 本 质 上 不 是 属性 ( 即 
使 讨论 的 集合 只 包含 1 个 属性 )， 因 为 它们 都 被 定义 成 了 相应 标题 的 子 集 (但 不 是 
真子 集 )。 因 而 ， 关 系 变量 S 的 唯一 码 是 {SNO} (注意 使 用 大 括号 )， 不 是 SNO。 同 
样 ， 关 系 变量 了 的 唯一 码 是 {PNO}， 关 系 变量 SP 的 唯一 码 是 {SNO，PNO}。 顺便 说 
一 下 , 注意 {SNAME} 不 是 关系 变量 S 的 码 , 因为 图 1.1 和 图 2.1 中 给 出 的 SNAME 
的 值 不 是 唯一 的 。 

第 二 ， 唯 一 性 是 很 明显 的 ， 但 是 我 要 解释 一 下 不 可 还 原 性 。 考 虑 关系 变量 S 
和 其 属性 集合 {SNO，CITY}( 称 作 SC)， 它 是 标题 $ 的 子 集 ， 具 有 唯一 性 (关系 
变量 S 的 有 效 值 中 不 存在 这 样 的 关系 ， 它 具有 和 SC 相同 的 值 )。 但 是 ， 它 不 是 不 
可 简化 的 ， 因 为 我 们 不 关心 属性 CITY 和 剩 下 的 属性 。 单 独 的 属性 集合 {SNO} 仍然 
具有 唯一 性 。 所 以 我 们 不 把 SC 看 作 码 ， 因 为 它 “ 太 大 了 ”。 相 反 ，{SNO} 是 不 可 
简化 的 ， 所 以 它 是 码 。 
因此 , 为 什么 我 们 想 让 码 具 有 不 可 简化 性 呢 ? 一 个 重要 的 原因 就 是 如 果 我 们 明 
确 提出 码 不 具有 不 可 简化 性 ， 那 么 DBMS 就 不 能 执行 恰当 的 唯一 性 约束 。 例 如 ， 
假设 我 们 告诉 DBMS (这 是 说 谎 !1), {SNO, CITY } 是 关系 变量 $ 的 码 , 那么 DBMS 
将 不 会 (事实 上 ， 也 不 能 ) 执行 这 个 约束 条 件 ， 即 供应 商号 码 在 全 局 上 是 唯一 的 。 
相反 ， 它 将 会 ， 也 只 能 执行 较 弱 的 一 个 约束 ， 即 供应 商号 码 在 局 部 上 是 唯一 的 。 因 
此 , 这 就 是 为 什么 我 们 需要 码 , 但 码 中 不 能 包含 进行 唯一 性 标识 时 不 需要 的 属性 的 
原因 (但 不 是 唯一 的 一 个 原因 )。 

第 三 ， 请 注意 码 的 概念 适用 于 关系 变量 ， 但 不 适用 于 关系 。 为 什么 ? 因为 说 某 
个 事物 是 码 ， 就 是 在 说 某 个 完整 性 约束 在 起 作用 ,并 且 完 整 性 约束 适用 于 变量 而 不 
是 数值 。( 按 照 定义 ， 完 整 性 约束 中 对 修改 进行 了 限制 ， 而 修改 操作 作用 于 变量 ， 
不 作用 于 数值 。 进 一 步 讨论 请 参见 第 6 章 ) 

第 四 , 也 是 最 后 一 点 ， 供 应 商 和 零件 数据 库 中 的 所 有 关系 变量 恰好 都 只 有 1 个 
码 。 但 是 一 个 关系 变量 可 能 会 有 2 个 或 多 个 码 。 下 面 是 几 个 这 样 的 例子 〈 只 是 扼要 
说 明 )。 

例 1; 

TAX BRACKET { LOW ... ，HIGH ... , RATE ... } 

KEY { LOW } 


KEY { HIGH } 
KEY { RATE } 


第 1 个 例子 的 意思 是 ， 如 果 你 的 应 纳税 收入 在 LOW 和 HIGH 之 间 ， 就 按照 特 
定 的 RATE 交 税 。 例 如 ， 如 果 你 的 应 纳税 收入 在 $10,000~~$19,999 之 间 ， 那 就 应 该 
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上 交 10% 的 税 ， 如 果 在 $20,000 至 $29,999 之 间 ， 则 应 该 上 交 15% 的 税 等 。 假 设 在 
一 个 公正 的 税收 系统 中 ， 税 率 随 着 应 纳税 收入 的 增加 而 增加 ，{LOW}、{HIGH} 和 























{RATE} 很 显然 就 都 是 码 。 
例 2: 
ROSTER  { ‘DAY. %- TLIME ecm ry CATE ,0s i PILOTP. 2; , 


KEY { DAY , TIME , GATE } 
KEY { DAY , TIME , PILOT } 


这 个 关系 变量 表示 简化 了 的 航班 时 刻 表 : 在 某 一 天 的 某 个 时 间 ， 某 个 飞行 员 轰 
驶 特定 的 航班 从 特定 的 登 机 口 起 飞 。 实际 上 ， 因 为 同一 个 飞行 员 不 可 能 在 同一 天 的 
同一 时 间 在 两 个 不 同 的 登 机 口 起 飞 ， 因 此 {DAY，TIME，GATE} 和 {DAY，TIME， 
PILOT} 都 是 码 。 注 意 ， 这 个 例子 中 的 码 有 重复 的 部 分 。 因 而 ， 码 中 有 重复 部 分 也 
是 可 能 的 ， 唯 一 的 原因 就 是 所 讨论 的 问题 的 码 是 组 合 的 〈 就 像 表 示 供 应 关系 的 关系 
变量 SP 的 唯一 码 一 样 )。 注 意 ,不 是 组 合 而 成 的 码 有 时 也 被 称 作 是 简单 码 ， 就 像 关 
系 变量 $ 中 的 {SNO} 和 关系 变量 P 中 的 {PNO }。 

例 3: 


人 
KEY {A,B 
KEY { B,C 
KEY { C ,A 


这 个 例子 的 含义 就 是 每 个 元 组 中 的 C 的 值 等 于 A 和 B 的 和 !。 显 然 {A，B}、{B， 
C} 和 {C，A} 都 是 码 ( 这 些 码 是 复合 的 ， 也 有 重复 )。 

对 于 主 码 的 解释 : 如 果 关 系 变量 R 具有 一 个 以 上 的 码 《〈 就 像 上 面 的 几 个 例子 ， 
这 是 很 常见 的 ， 但 不 是 必须 的 )， 挑 选 其 中 之 一 称 作 主 码 。 如 果 关 系 变量 R 只 有 一 
个 码 ， 只 因为 讨论 的 码 是 组 合 的 〈 就 像 关系 变量 SP 中 表示 供应 关系 的 唯一 码 )。 注 
意 ， 像 关系 变量 $ 中 的 码 {SNO} 和 关系 变量 P 的 码 {PNO}， 它们 不 是 组 合 的 ， 有 时 
又 称 为 简单 码 。 

在 最 后 这 个 例子 中 ， 其 含义 是 每 个 元 组 的 C 值 都 等 于 A 和 B 的 和 。 显 然 ， 
{A.B}、{B,Cy 和 {C,A} 都 是 码 〈 码 是 组 合 的 ， 但 是 也 有 重复 。 

关于 主 码 的 解释 : 如 果 关 系 变量 R 有 1 个 以 上 的 码 ， 就 像 上 面 的 这 个 例子 ， 通 常 选 出 
其 中 一 个 称 之 为 主 码 (但 并 不 是 必须 的 >) 。 如 果 关 系 变量 R 只 有 一 个 码 ， 通 常 也 称 之 为 
主 码 (但 这 也 不 是 必须 的 ) 。 然 而 ， 除 了 从 关系 模型 本 身 的 角度 来 看 以 外 ， 不 管 这 些 码 
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亚 








实际 上 ,PLUS 可 能 是 关系 常量 , 而 不 是 关系 变量 .对 于 关系 常量 的 定义 ,可 以 参见 SQL and Relational 
Theory， 其 中 有 进一步 的 讨论 。 
2 事实 上 ， 在 关系 模型 的 最 初 定义 中 这 是 必须 的 ， 但 是 现在 没有 更 好 的 逻辑 理由 来 解释 这 种 必须 性 。 
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是 否 被 标识 为 主 码 ， 选 择 其 中 哪 一 个 都 基本 上 是 心理 问题 (如 果 可 以 有 选择 的 话 )。 码 
本 身 是 必要 的 ， 但 主 码 不 是 必要 的 。 然 而 ， 在 图 1.1 和 图 2.1 中 ,关系 变量 只 有 一 个 码 ， 
我 就 用 双 下 划 线 标 出 属性 作为 主 码 来 进行 标识 。 


3.3 ”外 码 


现在 我 们 知道 每 个 关系 变量 都 至 少 有 一 个 码 ( 受 到 至 少 有 一 个 码 的 约束 限制 )。 
但 是 有 些 关 系 变量 还 要 受到 一 个 特定 的 外 码 〈foreign key) 的 约束 。 例 如 ，{SNO} 
就 是 关系 变量 SP 的 外 码 ， 要 参照 关系 变量 $ 中 的 主 码 {SNO}。 这 就 意味 着 ， 在 给 
定 的 时 间 t， 关系 变量 SP 包含 一 个 元 组 ,， 它 的 SNO 的 值 为 S3， 那 么 关系 变量 S 也 
必须 在 同样 的 时 间 t 含有 一 个 元 组 ， 它 的 SNO 值 也 为 S3 。 和 否则 ， 关 系 变量 SP 将 
会 展示 一 些 由 不 存在 的 供应 商 所 供应 的 零件 , 因而 这 个 数据 库 就 不 是 一 个 真实 情况 
的 正确 模型 了 。 

当然 ，{PNO} 也 是 关系 变量 SP 的 外 码 ,， 它 的 值 要 参照 关系 变量 的 主 码 {PNO} 
的 值 。 不 严格 地 说 , 在 某 种 程度 上 我 们 可 以 认为 外 码 约束 就 像 胶水 一 样 把 数据 库 绑 
定 在 一 起 ， 话 虽 如 此 ， 这 里 还 是 要 给 出 一 个 定义 。 

定义 : 关系 变量 R2 和 Rl1， 如 果 满 足以 下 条 件 : 

1. K 是 Rl 的 码 。 

2. FK 是 R2 标题 的 一 个 子 集 。 

3. 在 任何 时 候 ，R2 中 每 个 FK 的 值 都 要 与 R1 中 某 些 元 组 K 的 值 相等 。 
那么 FK 就 称 为 R2 的 外 码 ， 它 的 值 要 参照 R1 的 KK 值 。 注意 ， 如 果 FK 由 n 
个 属性 组 成 ， 那 么 FK 的 度 就 为 mn。 

实际 上 前 面 的 这 个 定义 是 被 简化 了 的 , 但 对 于 本 书 要 达到 的 目的 来 说 已 经 足够 
了 。 然 而 ， 我 还 要 指出 一 点 ，K 和 FK 要 由 相同 的 属性 组 成 是 不 言 而 喻 的 。 例 如 ， 在 
关系 变量 S 和 SP 中 ,关系 变量 S 的 主 码 属性 为 SNO， 类 型 为 CHAR， 那 么 相应 的 关系 
变量 SP 中 的 外 码 也 必须 叫做 SNO， 属 性 也 必须 为 CHAR。 也 就 是 说 (着 重 指出 这 一 
点 )，K 和 FK 中 每 个 属性 都 要 具有 相同 的 名 字 和 相同 的 属性 ， 它 们 要 相互 匹配 。 二 
实 上 ， 从 规范 角度 来 说 ， 它 们 必须 具有 相同 的 属性 。 参 见 本 章 练 习 3.2， 可 以 获得 
进一步 的 解释 说 明 '。 
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1 如 果 FK 中 某 个 属性 和 KK 中 与 它 相 对 应 的 那个 属性 具有 相同 的 类 型 , 但 不 具有 相同 的 名 字 (实际 上 ， 
这 种 情况 是 很 少见 的 ， 就 像 SOL and Relational Theory 一 书 中 解释 的 那样 )， 那 么 就 要 使 用 RENAME 
运算 符 ( 该 运算 符 将 在 第 4 章 中 描述 ) 来 帮忙 改名 。 对 于 这 一 点 的 解释 说 明 可 以 参照 SOL and 
Relational Theory， 也 可 以 参照 第 9 章 的 练习 9.5。 
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注意 : 我 还 要 再 次 强调 这 个 术语 。 首 先 ， 外 码 是 关系 模型 中 保持 参照 完整 性 的 
种 参照 性 ， 就 像 关 系 变量 SP 中 SNO 的 值 S3 





一 种 实现 方式 :， 即 外 码 的 值 代 表 着 一 
要 参照 关系 变量 S 中 相应 元 组 的 值 一 样 。 





元 组 已 参照 了 元 组 已 ， 那 么 元 组 忆 必须 存在 。 因 而 ， 如 果 想 要 删除 一 个 供应 商 元 组 























实际 上 ， 参 照 完 整 性 规则 很 简单 ， 




















即 如 果 





的 想法 必定 要 失败 ， 因 为 不 能 留 下 任何 “ 惹 挂 着 的 参照 关系 ”( 例 如 ， 关 系 变量 SP 

















一 








K 就 是 被 参照 码 (或 目标 码 )。 


3.4 天 系 变量 定义 

















中 对 于 供应 商 的 参照 就 不 存在 了 ， 这 就 是 一 个 “ 惹 挂 着 的 参照 关系 ”)。 
定义 中 的 关系 变量 R2 和 R1 可 以 分 别称 为 参照 关系 和 被 参照 关系 〈 或 者 称 为 
目标 关系 )。 由 此 可 以 推断 ，R2 中 的 元 组 如 和 R1 中 对 应 的 元 组 17 就 分 别 成 为 参 
照 元 组 和 被 参照 元 组 (或 目标 元 组 ;。 如 果 FK 是 R2 的 外 码 ， 那 么 RI1 














对 应 的 码 


现在 (也 是 最 后 ) 我 们 有 能 力 来 理解 Tutorial D 的 关系 变量 S、P 和 SP 的 定 











义 。 下 面 是 关系 变量 $ 的 定义 : 
VAR S BASE 
RELATION 
{ SNO CHAR ， 
SNAME CHAR ， 
STATUS INTEGER ， 
CITY CHAR } 
KEY { SNO } ; 


说 明 如 下 : 








口 ”关键 词 VAR 指出 ， 这 个 语句 从 总 体 上 定义 了 一 个 变量 (当然 ， 在 目前 的 








一 











严格 地 说 ， 基 本 关系 变量 就 是 可 以 单独 存 如 















































青 况 下 是 一 个 关系 变量 )。 讨 论 的 变量 名 称 为 $S， 关 键 词 BASE 标识 定义 
的 变量 类 型 ， 它 代表 的 是 “基本 关系 变量 ”， 这 是 关系 变量 S 的 


类 型 。 (不 




















E 的 变量 ， 不 需要 依靠 其 他 关系 


变量 来 定义 。 其 他 类 型 的 关系 变量 也 确实 存在 ， 其 中 最 重要 的 是 虚 关 系 变 















































把 关系 变量 都 简化 为 基本 关系 变量 。) 
口 ” 接 下 来 的 5 行 定义 了 变量 的 类 型 (当然, 也 是 关系 型 的 。 回 顾 第 2 章 练习 





2.8 的 答案 ， 指 出 关系 变量 和 所 有 的 变量 一 样 都 要 具有 











RELATION 表示 它 只 一 种 关系 























量 或 称 为 视图 ， 这 将 在 第 7 章 给 出 简要 介绍 。 然 而 ， 在 这 之 前 ， 我 们 还 是 


种 类 型 )。 关 键 词 


类 型 ， 下 面 4 行 放 在 一 起 说 明了 对 应 的 标 


1 从 历史 记载 来 看 ， 我 认为 参照 完整 性 (referencial integrity) 这 个 术语 来 自 于 Codd， 他 入 








模型 的 特殊 性 时 定义 了 这 个 概念 。 但 是 和 术语 





E 讨 论 关 系 

















相反 ， 这 个 概念 要 早 于 关系 模型 。 
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题 。 标 题 中 属性 的 顺序 没有 规定 ， 因 为 标题 是 属性 的 集合 。( 就 像 第 2 章 
给 出 的 解释 ,在 纸 上 表 示 集 合 时 通常 用 大 括号 把 元 素 包 围 起 来 ， 元 素 之 间 
用 逗号 隔 开 ， 并 且 元 素 的 顺序 是 没有 关系 的 。 因 而 ，{a2cd 和 {aact} 
表示 同样 的 集合 。) 
口 ”最 后 一 行 定义 了 关系 变量 的 主 码 {SNO}。 注 意 ，KEY 是 关系 变量 定义 的 
一 部 分 ， 不 是 类 型 说 明 的 一 部 分 。 
下 面 我 们 讨论 一 下 关系 类 型 的 定义 , 首先 关系 和 关系 变量 一 样 都 要 具有 某 种 类 
型 (就 像 我 们 在 第 2 章 练习 2.8 的 答案 中 看 到 的 一 样 )， 就 像 关系 变量 S 定义 中 
示 的 一 样 ，Tutorial D 中 的 关系 类 型 采用 如 下 形式 定义 : 


RELATION heading 


Heading 的 格式 : 


{ attribute commalist } 


Attribute 采用 如 下 形式 定义 : 
attribute-name type-name 
实际 上 , 有 一 个 相当 充分 的 理由 来 解释 需要 关系 类 型 具有 这 种 特定 形式 名 字 的 
原因 ， 参 见 第 4 草 和 第 5 章 的 的 闭 包 ， 可 以 得 到 更 清楚 的 解释 。 
下 面 是 关系 变量 P 的 定义 : 
VAR P BASE 
RELATION 
{ PNO CHAR ， 
PNAME CHAR ， 
COLOR CHAR, 
WEIGHT RATIONAL ， 


CITY CHAR } 
KEY { PNO }; 


与 上 面 定义 唯一 不 同 的 地 方 在 于 类 型 RATIONAL 和 属性 WEIGHT。RATIONAL 
是 TutorialD 的 类 型 名 ， 在 其 他 语言 中 称 作 REAL。 它 是 系统 定义 的 类 型 ， 通 常 由 
两 个 整数 的 比率 值 表示 例如 : 3/8、5/12、-4/3)。 

实 型 值 的 解释 : 在 十 进 制定 义 中 ， 实 型 值 具有 如 下 特性 ， 小 数 部 分 由 有 限 的 非 零 数字 

组 成 ， 后面 可 以 接 无 限 个 0， 在 没有 损失 的 情况 下 ， 可 以 把 0 省略 (例如 : 3/8=0.375000...， 

2/1=2.000... ), 台 小 数 部 分 由 有 限 序 列 的 数字 组 成 , 后面 可 以 接续 另 一 个 有 限 序列 的 数字 ， 

但 是 第 一 个 必须 是 非 0 的 ， 也 可 以 无 限 循环 (例如 : 5/12= 0.41666.… )。 

最 后 给 出 关系 变量 SP 的 定义 : 

VAR SP BASE 


RELATION 
{ SNO CHAR, 
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PNO CHAR ， 
OPY INTEGER } 
KEY { SNO , PNO } 
FOREIGN KEY { SNO } REFERENC 
FOREIGN KEY { PNO } REFERENC 
这 里 唯一 与 
































3.5 ”导入 数据 库 
























































ES S 
ES P 





了 
















































































上 面 不 同 的 是 FOREIGN 的 说 明 ， 这 是 很 明显 的 ， 不 需要 解释 。 
















































































































































































































































































































































































默认 情况 下 ， 第 一 次 创建 时 基本 关系 变量 都 是 空 的 〈 例 如 ， 刚 定义 时 )， 也 就 
是 说 ， 它 们 的 初 值 是 相应 类 型 的 一 个 空 关系 :。 为 了 导入 数据 库 ， 我 们 要 用 关系 赋 
值 语 句 。 例 如 ， 下 面 的 赋值 语句 ， 完 成 的 是 给 关系 变量 S 赋 值 ， 它 的 值 取 自 图 1.1 
和 图 2.1 的 值 。 

S := RELATION 

{ TUPLE { SNO 'S1' , SNAME 'Smith' , STATUS 20 , CITY 'London' } ， 

TUPLE { SNO 'S2' , SNAME 'Jones' , STATUS 10 , CITY 'Paris' } ， 

TUPLE { SNO 'S3' , SNAME 'Blake' , STATUS 30 , CITY 'Paris' } ， 

TUPLE { SNO 'S4' , SNAME 'Clark' , STATUS 20 , CITY 'London' } ， 

TUPLE { SNO 'S5' , SNAME 'Adams' , STATUS 30 , CITY 'Athens' } }) :; 

当然 我 们 也 可 以 采用 INSERT 语句 进行 赋值 (虽然 INSERT 语句 要 依赖 于 目标 
关系 变量 S， 初 始 值 是 否 为 空 ， 这 在 赋值 语句 中 没有 明确 说 明 )， 如 下 : 

INSERT S RELATION 

{ TUPLE { SNO 'S1' , SNAME 'Smith' , STATUS 20 , CITY 'London' } ， 
TUPLE { SNO 'S2' , SNAME 'Jones' , STATUS 10 , CITY 'Paris' }) ， 
TUPLE { SNO 'S3' , SNAME 'Blake' , STATUS 30 , CITY 'Paris' }) ， 
TUPLE { SNO 'S4' , SNAME 'Clark' , STATUS 20 , CITY 'London' } 
TUPLE { SNO 'S5' , SNAME 'Adams' , STATUS 30 , CITY 'Athens' } } :; 
当然 ， 关 系 变量 P 和 SP 都 可 以 采用 这 种 方式 进行 赋值 。 注 意 : 在 前 面 2 个 赋值 
语句 中 , 给 关系 变量 S 赋 值 的 这 种 表达 方式 是 关系 标识 符 (relation literal ) 的 一 种 ?。 
因此 ， 正 如 您 所 看 到 的 ，Tutorial D 中 的 关系 标识 符 采 用 如 下 形式 : 

RELATION body 

这 里 body 采用 如 下 形式 定义 : 

{ tuple literal commalist } 

1 这 里 应 该 说 明 一 个 非 空 的 初 值 ， 但 是 超出 了 本 书 的 范围 。 

2 两 点 说 明 : 首先 ， 关 系 标识 符 是 通常 构造 关系 时 称 作 关 系 选择 器 调用 的 一 种 特殊 用 法 ;第 二 ， 这 里 
给 出 的 语法 1 中 的 标识 符 是 经 过 简化 的 ， 但 只 是 轻 度 简化 。 第 一 点 将 在 第 7 章 解释 ， 第 二 点 参照 本 
章 后 面 的 练习 3.3。 
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tuple literal 采用 如 下 形式 定义 ; 


TUPLE { component commalist } 


component 采用 如 下 形式 定义 : 

attribute-name literal 

当然 , 在 定义 体 中 列 出 的 元 组 顺序 是 没有 关系 的 ， 每 个 元 组 标识 符 的 组 成 部 分 
的 顺序 也 是 没有 关系 的 。 
导入 数据 库 的 论述 ， 实际 上 ,除了 极 小 的 数据 库 以 外 ， 所 有 的 数据 库 都 很 
元 长 、 庞 大 ， 所 以 它 不 能 采用 关系 赋值 语句 或 者 INSERT 语句 进行 赋值 来 进行 数据 
库 的 导入 。 实 际 数据 库 的 导入 不 是 采用 手工 进行 的 , 而 是 通常 由 称 为 数据 库 管理 员 
(DBA) 的 这 个 具有 特殊 权利 的 用 户 进行 导入 ， 它 通常 采用 某 种 实用 程序 来 实现 数 
据 库 的 导入 (“导入 实用 程序 包 ”)。 人 然而， 无 论 这 个 导入 实用 程序 真正 做 了 什么 ， 
从 逻辑 上 来 说 它 都 等 价 于 执行 了 若干 的 关系 赋值 语句 。 

注意 : 在 实际 的 数据 库 中 ， 关 系 变量 也 许 是 被 定义 的 ， 有 时 也 是 被 DBA 导入 
的 (通常 在 第 一 次 创建 数据 库 的 时 候 )。DBA 负责 大 量 管理 和 维护 工作 ， 但 这 些 都 
超出 了 本 书 的 范围 。 


3.6 ”数据 库 系 统 和 程序 系统 对 比 


可 顾 第 1 草图 1.3 给 出 的 代码 片段 ， 我 从 编程 的 角度 来 说 明 相似 的 一 些 概念 : 
语 多、 类型、 变量、 赋值 、 标 识 符 、 只 读 运 算 符 〈 包 括 比 较 运 算 符 )。 我 之 前 说 过 
这 些 概念 都 是 和 数据 库 相 关 的 《当然 尤 指 关 系数 据 库 )， 所 以 下 面 我 们 看 看 他 们 的 
相似 之 处 。 
口 “ 关 系 语 句 : 我 们 已 经 看 到 了 关系 语句 ,，“INSERT、DELETE、UPDATE 语 
句 和 VARE 语句 ”具有 更 好 的 用 户 友好 性 (VAR 通常 用 来 定义 变量 ， 特 
殊 的 时 候 用 来 定义 关系 变量 )。 
口 ”关系 类 型 从 前 面 的 叙述 中 我 们 已 经 看 到 了 关系 和 关系 变量 都 具有 类 型 ， 
就 像 Tutorial D 采用 关键 词 RELATION 定义 的 一 样 ， 后 面 紧 跟着 可 用 的 
标题 。 我 们 也 看 到 了 各 种 属性 类 型 (如 : INTEGER、CHAR、RATIONAL)， 
而 且 我 们 已 经 讨论 了 一 些 用 户 自 定义 的 类 型 。 
口 “ 关 系 赋值 : 看 上 面 关 系 语句 的 相关 说 明 (第 1 点 。 
口 ”关系 标识 符 :“ 导 入 数据 库 ” 这 一 部 分 给 出 了 一 个 标识 符 的 说 明 ， 我 们 也 
看 到 了 一 些 表示 数量 的 标识 符 (如: “S1”、‘Smith”、20、‘London” 等 ， 
以 及 元 组 标识 符 ( 例 如，TUPLE { SNO ‘S1’, SNAME ‘Smith’”, STATUS 20， 
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CITY ‘London’} )。 
口 “ 关 系 值 : 在 任何 时 候 ， 关 系 变量 S、P 和 SP 的 值 就 是 关系 值 。 当 然 ， 由 关 
系 标 识 符 说 明 的 也 是 关系 值 ， 如 上 一 点 所 述 。 
口 “ 关 系 型 只 读 运算 符 : 虽然 前 面 我 们 已 经 看 到 了 一 些 例子 , 但 这 一 点 仍 将 在 
第 4 章 和 第 5 章 详细 讨论 。 也 可 以 参照 第 1 章 的 练习 1.1。 
口 “ 关 系 型 比较 运算 符 : 将 在 第 4 章 详细 讨论 。 



























































3.7 ”练习 
3.1 考虑 下 面 的 关系 类 型 《从 本 章 的 关系 变量 P 中 抽取 的 一 部 分 ): 


RELATION { PNO CHAR , PNAME CHAR , COLOR CHAR ， 
WEIGHT RATIONAL , CITY CHAR } 


如 果 考 虑 从 左 到 右 的 属性 顺序 ， 可 以 定义 多 少 种 零件 的 关系 变量 ? 

3.2 ”考虑 本 章 给 出 的 外 码 定 义 ， 我 曾 指出 本 章 默 认 了 外 码 FK 和 目标 码 K 1 
完全 一 致 的 属性 组 成 ,但 是 这 个 定义 为 什么 要 做 这 样 的 假设 呢 ? 我 的 意思 是 说 ， 这 
个 定义 是 如 何 依赖 于 这 个 假设 的 呢 ? 

3.3 在 3.5 节 , 我 说 Tutorial D 的 关系 标识 符 采 用 了 关键 字 RELATION 定义 ， 
后 面 紧 跟着 由 大 括号 包围 起 来 的 一 组 元 组 标识 符 ， 元 组 标识 符 之 间 用 运 号 隔 并 。 虽 
然 我 没有 说 这 些 元 组 标识 符 也 要 具有 相同 的 属性 ， 这 些 属性 也 在 标题 中 明确 定义 
了 ， 还 有 由 关系 标识 符 说 明 的 关系 类 型 ， 但 是 假设 元 组 标识 符 的 逗号 列表 是 空 的 
(例如 , 假设 我 们 用 一 个 标识 符 来 标识 一 个 空 的 关系 )， 那么 相应 的 关系 类 型 应 该 如 
何 决 定 呢 ? 

3.4 如 果 所 讨论 问题 的 供应 商 当前 存在 一 些 供应 关系 ， 那 么 如 果 删 除 一 个 供 
应 商 将 会 发 生 什么 事情 呢 ? 

3.5 我 曾经 说 过 关系 模型 禁止 使 用 指针 ， 在 不 同 的 表示 方式 下 ， 外 人 码 是 不 是 
站 针 呢 ? 


































































































































































































3.8 答案 


已 





3.1 对 于 第 一 个 属性 就 有 5 种 可 能 的 选择 ， 那 么 对 于 这 5 种 可 能 性 ， 第 二 个 
属性 就 有 4 种 选择 ; 然后 , 对 于 这 4 种 可 能 性 , 第 三 个 属性 有 3 个 选择 , 以 此 类 推 。 
因此 ， 就 有 5! =5*4*3*2*1=120 种 不 同 的 可 能 性 。( 也 许 这 个 练习 会 给 您 一 些 暗 
示 ， 为 什么 关系 模型 中 不 要 求 关 系 的 属性 必须 从 左 到 右 排 列 顺序 。 回 顾 第 1 章 开 
头 的 引 语 !) 




































































3.2 ”这 个 答案 需 
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集合 ， 





每 个 组 件 晶 
































就 暗示 了 它们 肯定 共有 
他 的 整 型 值 (也 不 等 于 




















当 它 们 共有 同样 的 元 组 。 这 就 意味 着 ， 





合 ， 假设 为 41，A42， 








相同 的 类 型 )。 例 
的 值 )。 同 样 ， 








竹 何 其 他 类 型 





些 特定 的 背景 知识 。 首 先 ， 我 需要 强调 一 点 ， 元 组 就 
属性 和 对 应 的 属性 值 组 成 。 现 在 ， 
1 章 提 到 的 六 和 ?72 的 值 , 当 且 仅 当 它们 其 有 相同 值 的 时 候 才 认为 它们 是 相等 的 
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(这 














如 ， 整 型 值 3 等 于 整 型 














直 3， 而 不 等 于 其 

































































男 一 上 把 是 ， 因 








TUPLE { SNO 'S1' 





在 数学 上 ， 子 集 实际 上 也 是 
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TUPLE { CITY 'London' } 














首 9 











1.1 和 图 
他 的 元 组 。 
为 元 组 是 集合 ， 那 么 它 就 有 
图 2.1 中 供应 商 S1 的 许多 ! 子 集 的 2 个 ( 采 











2.1 中 供应 商 S1 的 元 








子 集 



































'London' } 








元 组 实际 上 也 是 一 个 元 组 。 














我 们 
相应 的 


返回 
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和 图 2.1 中 供 


TUPLE { SNO 








'S1! 


现在 假设 我 们 要 向 参照 
不 外 码 约 


R2)， 为 了 保证 不 破 : 


到 外 码 定义 。 
目标 码 。FK 和 K 都 是 属性 的 集合 〈 
因而 ，FK 和 的 值 也 是 元 组 (也 可 





千本 草 给 
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人 
能 是 


的 关系 变量 中 插入 一 个 元 组 ( 即 





























关系 变量 K 的 值 是 否 相等 ( 即 定义 中 的 R1)。 但 是 这 些 比较 都 是 在 7 
意义 的 唯一 办 法 是 让 FK 和 K 具有 相同 上 
法 的 唯一 办 法 是 让 这 个 评价 的 值 为 TRUE)， 这 就 意味 











的 ， 因 
意思 


着 它们 必须 包含 相同 的 


题 外 话 : 




















而 ， 这 个 操作 进行 的 有 


是 说 ， 这 些 比 较 能 否 合 


前 面 的 讨论 指 








属性 集合 。 























(a) 标题 的 每 个 子 集 还 是 标题 ; 














出 ， 元 组 的 每 个 子 集 也 是 元 组 ， 而 


束 ， 系 统 就 要 比较 新 元 组 FK 的 值 与 已 


。 例 如 ， 这 里 给 出 了 
djTutorial D 形 式 定义 ): 


两 个 元 组 如 和 巡 相等 ， 当 且 仅 
E，1 和 12 必须 同时 具有 相同 的 属性 集 
...，An; 其 次 ， 对 于 所 有 的 i (二 1,2,...,n)， 生 | Ai 的 值 必须 
等 于 刀 中 Ai 的 值 。 例如， 考虑 图 
身 是 相等 的 ， 但 不 等 于 任何 





组 ， 这 些 元 组 与 目 








图 1.1 和 


个 集合 (参见 附录 C)， 所 以 在 关系 模型 中 ， 子 








出 的 外 码 定 义 中 ， 令 FK 表示 外 码 、 玉 表示 
因为 它们 每 个 都 是 相应 标题 的 子 集 )。 
真子 元 组 ， 但 肯定 是 元 组 )。 例 如 ， 
应 商 S1 元 组 的 码 值 就 是 真子 元 组 。 
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1.1 











定义 中 的 关系 变量 








存在 的 被 引用 
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组 之 间 进 行 
的 类 型 (我 的 




















(b) 定义 体 的 每 个 子 集 仍然 是 定义 体 。 


























3.3 在 回答 这 个 问题 之 前 ， 我 要 明 胡 
数学 的 角度 来 说 是 有 一 个 空 




















1 实际 上 有 多 少 个 呢 ? 











|L， 由 此 可 以 推断 ， 





角 指 出 〈 就 像 本 章 中 定义 的 那样 )， 虽 然 从 








集 , 但 是 在 关系 模型 中 可 以 有 许多 不 同 的 空 关系 。 


上 ， 对 于 每 种 可 能 的 关系 类 型 也 只 有 一 种 空 关系 。 例 如 ， 空 的 供应 商 关系 和 空 的 零 














事实 
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件 关 系 肯 定 是 不 同 的 ， 
他 们 属于 不 同 的 类 型 :。 





因为 虽然 他 们 的 定义 体 相 同 ， 但 是 他 们 有 不 同 的 标题 ， 











因此 





现在 回 到 这 个 问题 本 身 。 显 然 , 如果 我 们 想 让 一 个 标识 符 代表 某 个 特定 关系 类 








型 中 的 空 关系 , 那 就 没有 办 法 从 定义 体 的 元 组 








中 没有 元 组 。 针 对 这 个 
是 不 相同 的 : 


RELATION body 


替换 为 : 























P 推 有 这 个 关系 的 类 型 ， 因 为 定义 体 


原因 ，TutorialD 的 关系 标识 符 的 语法 与 本 章 前 面 我 所 说 的 





RELATION [ heading ] body 


heading 和 body 的 语法 在 本 章 曾 经 解释 过 。 但 是 ， 通 常情 况 下 heading 是 可 选 

了 中 括号 的 原因 )， 但 即使 gody 是 空 的 ， 也 必须 要 说 明 。 
3.4 一 种 可 能 性 就 是 当 引 用 完整 性 被 破坏 时 ， 这 种 企图 就 会 失败 。 一 种 更 复 

杂 的 可 能 性 (同时 由 Tutorial D 和 SQL 文 持 ) 是 允许 有 “级 联 删除 规则 ”的 ， 即 


的 《这 就 是 我 为 什么 加 

































































在 定义 SP 中 的 外 码 时 要 特殊 说 明 其 关联 性 , 这 样 对 关系 变量 $ 执行 DELETE 
在 SP 中 自动 执行 DELETE 操作 ， 具 有 相同 供应 商号 











的 所 有 元 组 就 会 从 S 中 删除 。 


3.5” 不， 它们 不 是 。 论 文 Inclusion Dependencies and Foreign Keys (Database 





Explorations 一 书 的 第 13 章 ， 由 Hugh Darwen 和 我 在 2010 外 
论述 ”) 列 出 了 这 2 个 概念 的 14 种 逻辑 上 的 差异 , 这 里 我 只 





三 次 声明 和 相关 主题 的 
提 到 一 种 。 指 针 是 有 方 
则 的 数值 ， 因 而 它们 和 











例如 ， 包含 PNO 的 值 为 P4 的 供应 关系 元 组 (当然 ,在 外 码 中 也 必须 有 这 个 


只 是 被 关联 到 零件 号 为 
何其 他 的 所 有 元 组 ( 即 























E 特 拉 福 德 撰写 的 “第 

































































向 性 的 、 是 单独 的 、 基 有 特定 目标 的 ， 相 反 ， 外 码 的 值 是 规 








关系 数据 库 中 所 有 的 数值 一 样 ， 可 以 被 称 作 “多 向 关 


9 
Oo 
































值 ) 不 

















P4 的 零件 元 组 ， 也 被 关联 到 所 有 其 它 的 供应 关系 元 组 
数据 库 中 别 的 地 方 )， 这 些 元 组 的 PNO 恰好 有 具有 了 P4 值 。 






































和 任 








1 作为 一 个 题 外 话 ， 两 个 不 















































除了 这 种 特殊 的 情况 外 ， 两 个 关系 具有 相同 的 定义 体 当 且 仅 当 它们 是 相同 的 关系 。 








司 的 关系 可 以 具有 相同 的 定义 体 ， 当 且 仅 当 它 们 是 空 关系 时 。 换 名 话说 ， 


第 4 章 


关系 运算 符 | 


这 是 一 个 狂欢 之 夜 ， 我 却 像 一 只 小 狗 一 样 在 工作 着 ， 
一 一 John Lennon 和 Paul McCartney: A Hard Day’s Night 























在 供应 商 / 零 件数 据 库 中 己 经 定义 了 关系 变量 (参见 第 3 章 ) ， 并 且 已 经 导入 数 
据 或 完成 了 初始 化 (参见 第 3 章 ) ， 我们 可 以 使 用 它们 “真正 的 工作 ”了 。 更 准确 
地 说 ， 可 以 在 这 些 关 系 变量 上 执行 一 些 查 询 ( 例 如 ， 发 出 检索 请 求 ) ， 使 用 的 运算 
符 称 之 为 关系 代数 (relational algebra) ， 在 这 一 章 中 ， 要 开始 探索 这 些 运 算 符 。 警 
告 : 令 人 愧 恼 的 是 ， 这 一 章 相当 长 ， 你 可 能 一 次 只 能 看 一 部 分 。 为 了 在 这 方面 给 您 
提供 帮助 ， 我 没有 把 练习 和 答案 完全 放 在 本 章 最 后 ， 而 是 在 本 章 内 容 常规 的 讲解 中 ， 
相隔 一 段 距离 就 放置 了 部 分 的 练习 和 答案 。 


4.1 Codd 的 原始 代数 


关系 代数 由 运算 符 的 集合 组 成 〈 不 严格 地 讲 ) ， 可 以 允许 我 们 从 “ 旧 ” 的 关系 产生 
“新 ”的 关系 。 每 个 运算 符 都 可 以 将 一 个 或 多 个 关系 作为 输入 ， 产 生男 一 个 关系 作为 输 
出 。 例 如 ， 减 法 (difference) 运算 符 (在 Tutorial D 中 为 MINUS) ， 使 用 两 个 关系 作 
为 输入 ， 把 一 个 从 另外 一 个 中 减 掉 ， 产 生 另 外 一 个 关系 作为 输出 。 输 出 另外 一 个 关系 ， 
这 一 点 是 非常 重要 的 (这 就 是 所 谓 的 关系 代数 中 的 闭 包 ) ， 重要 的 原因 就 是 它 允 许 我 们 
写 入 由 套 的 关系 表达 式 。 强 调 一 点 ， 因 为 每 个 运算 的 输出 都 与 输入 具有 相同 的 类 型 ， 每 
个 运算 的 输出 又 可 以 成 为 男 一 个 运算 的 输入 。 例如 , 我 们 执行 减法 操作 ， 即 r1 MINUS 
72， 它 的 运算 结果 要 和 关系 x3 求 并 集 ， 这 个 并 集 的 结果 要 和 关系 r4 求 交 集 ， 等 等 。 

和 传统 算术 做 个 类 比 ， 有 可 能 会 帮助 您 理解 。 在 算术 中 ， 我 们 可 以 计算 两 个 数 
字 a 和 4b 的 和 ,得 到 结果 为 c， 这 个 输出 c 还 可 以 作为 输入 (因为 它们 都 是 数字 )， 
所 以 我 们 可 以 把 这 个 输出 作为 一 个 乘法 操作 的 输入 , 这 个 乘法 操作 的 输出 还 可 以 作 


































































































































































































































































































































































































为 减法 操作 的 输入 等 等 。 换 句 话说 ,在 规则 的 算术 运算 符 中 ,数字 形成 了 一 个 封闭 


的 系统 ，j 
算 符 中 也 是 封闭 的 ， 
现在 ， 可 以 定义 任意 数量 的 运算 符 ， 它 都 适合 
个 输入 都 恰好 产生 一 个 输出 。 
Codd 在 他 早期 的 论文 中 定义 的 ) 
算 符 , 并 且 在 第 $ 章 还 要 描述 
可 以 看 本 书 开篇 部 分 的 一 些 
曾经 说 过 的 那样 ， 在 接 下 来 的 部 分 ， 我 会 通过 大 量 的 从 








求 返 回 供应 商 关 系 


属 怕 





本 


特定 的 关系 。 例 如 ，r? 表示 供 
上 的 投影 ， 然 后 《仍然 要 供 








因此 ， 我 们 可 





























下 面 我 简单 描述 






































限制 (Restrict) 


从 特定 的 关系 中 返回 满足 特定 条 伯 
P STATUS 的 值 小 于 25 的 元 组 。 





投影 (Project) 


返回 一 个 新 的 关系 ,该 关系 
被 删除 了 《就 像 第 














乘积 (Product) 








返回 一 个 新 关系 ,该 关系 中 所 有 元 组 是 两 个 元 组 的 组 合 , 每 个 元 组 分 别 来 自 于 

















描述 ? 虽 然 理 








S 被 删除 了 











Ph 包含 特定 关系 9 
3 章 中 练习 3.2 的 答 



































是 SNO-PNO 所 有 可 能 的 组 合 ， 
是 零件 关系 中 的 零件 号 。 注 意 : 





应 商 关 系 妖 
i 助 于 闭 包 特性 〉 我 们 形成 一 


E SNO 





这 就 是 允许 我 们 写 髓 套 的 算术 表达 式 的 原因 








。 同样 
以 写 嵌 套 的 关系 表达 式 。 





， 关 系 在 关系 代数 的 运 





于 这 个 简 身 














| 


的 定义 ， 即 一 个 或 多 

















下 最 初 的 运算 符 是 什么 样 的 〈 即 
'。 在 本 章 接 下 来 的 儿 部 分 中 我 将 详细 解释 这 些 运 
些 其 他 的 运算 符 。 注意 : 如 果 你 不 熟悉 这 些 运 算 符 ， 











解 起 来 会 有 


困难 




















， 但 是 不 要 担心 。 就 像 我 






































































































































1 这 是 


问 

















不 包括 Codd 附加 定义 的 运算 符 ， 








对 











题 可 以 通过 image relations 更 好 





算 符 有 时 就 称 为 笛 卡 儿 “〈cartesian ) 乘积 


restrict project 


F 的 元 组 ， 构 成 一 个 间 








| 





步 一 步 地 详细 讲解 。 


新 的 关系 。 例 如 ， 我 们 要 


FP 的 所 有 元 组 或 子 元 组 , 但 是 有 些 
案 说 明 的 一 样 ， 子 元 组 仍然 是 元 组 ， 子 
集 仍然 是 集合 ) 。 例如， 在 供应 商 关 系 中 进行 投影 ， 只 保留 SNO 和 CITY 属性 〈 因 
此 ， 属 性 SNAME 和 STATU 

















上 的 投影 ，r2 表示 零件 关系 在 PNO 





个 rl 和 2 的 乘积 ， 结 果 就 
SNO 的 值 是 供应 商 关系 中 的 供应 商号 ，PNO 的 值 
这 里 的 “乘法 ”实际 上 是 笛 卡 儿 《〈cartesian ) 乘积 ， 


ode 
1 
和 








oovp 








分 将 在 





4.1 原始 的 关系 代数 


第 5 章 介 








区 





绍 。 





onoovoppy 





Cx xx 








即 除 (divide )。 我 忽略 了 这 个 运算 符 ， 因 为 假设 除法 解决 的 
也 解决 ， 这 部 





4.1 Codd 的 原始 代数 41 


人 = sa union difference 



















































































A 万 了 bl ol al bl 二 
a2 b1 b2 v2 a2 Pept 
水 b2 es we 已 了 b2 2 






































图 4.1 原始 的 关系 代数 〈 续 ) 


交 (Intersect) 





返回 一 个 新 关系 ， 该 关系 中 的 所 有 元 组 要 同时 出 现在 两 个 特定 的 关系 中 。 














并 〈Union) 














返回 一 个 新 关系 ， 该 关系 中 的 所 有 元 组 可 以 出 现在 两 个 特定 关系 的 一 个 当中 。 











差 (Difference) 

返回 一 个 新 关系 ， 该 关系 中 的 所 有 元 组 只 能 出 现在 第 一 个 关系 
第 二 个 关系 中 。 

联接 (Join) 

















中 ,不 能 出 现在 





返回 一 个 新 关系 ,该 关系 中 的 所 有 元 组 都 是 两 个 元 组 的 组 合 ， 两 个 元 组 分 别 来 


















































于 两 个 特定 的 关系 ， 这 两 个 元 组 中 具有 相同 的 属性 ， 并 且 上 其 有 相 


























同 的 属性 值 ( 这 























些 相同 的 属性 值 在 结果 中 只 出 现 一 次 ， 而 不 是 两 次 ) 。 注 意 : 这 种 



























































联接 运算 最 初 叫 


ee 
部 分 内 容 将 在 本 书 第 三 部 分 的 第 11 章 人 简单 介绍 ) 。 因 为 自然 联接 是 极 重要 的 一 种 


























联接 运算 ， 非 正规 的 术语 联接 就 成 为 了 种 标准 的 表示 ， 其 含义 就 
书 自始至终 都 将 采用 这 种 表示 方式 。 
最 后 ， 结 束 本 部 分 之 前 我 还 要 强调 几 点 。 
























































是 自然 联接 。 本 





口 ”代数 运算 符 是 通用 的 :实际 上 它们 可 以 应 用 于 所 有 可 能 的 关系 中 。 例 如 ， 
我 们 不 需要 定义 一 个 联接 运算 符 去 联接 供应 商 和 供应 关系 , 再 定义 另外 一 


























个 联接 运算 符 去 联接 部 门 和 雇员 。 
口 “运算 符 也 是 集合 ， 或 者 说 是 关系 : 它们 都 采用 关系 作为 运 
个 的 元 组 ， 也 返回 整个 关系 作为 结果 '。 









































到 算数 ， 而 不 是 单 











1 INSERT、DELETE、UPDATE (和 关系 复制 ) 都 是 集合 运算 符 。 实 际 上 ， 关 系 模型 不 包括 元 组 级 别 
上 的 运算 符 , 尽管 有 时 按照 元 组 解释 会 方便 一 些 (可 以 参照 第 5 章 给 出 的 图 像 关系 的 例子 , 或 者 参 




















见 附录 DD 的 等 价 描述 )。 











符 也 是 只 读 的 : 它们 读 入 运算 数 ， 


返回 一 个 结果 ， 但 是 不 修改 任何 




















uy 


汕 n| 














了 从 人 








攻 









































RI 和 和 R2 人 变量 名 ， RI MINUS R2 在 Tutorial D 肯定 是 一 个 有 效 
这 些 名 字 说 明 的 关系 变量 具有 
然后 ， 在 这 种 表达 式 中 ，R7 和 R2 本 身 没有 











的 关系 表达 式 ( 只 要 
细 讲 解 ) 。 
































j 关 系 变量 。 例 如 ， 如 果 


























司 的 属性 ， 后 面 详 
说 明 这 些 变量 ， 相 






































反 , 在 对 表达 式 求 值 时 ， 它 们 说 明 
系 。 换 句 话 说， 我 们 肯定 要 使 


H 




















了 与 这 些 关 系 变量 具有 
一 个 关系 变量 名 把 运算 数 赋 了 予 一 个 关系 代 











相同 值 的 那些 关 




















数 运算 符 ， 这 样 的 关系 变量 引用 就 
理论 上 来 说 ， 我 们 可 以 使 用 恰当 上 
做 个 类 比 , 假设 N 是 整 型 变量 ， 在 时 | 


构成 了 














本 上 的 值 





的 关系 标识 符 来 替代 这 个 相 

















种 简单 的 关系 表达 式 。 但 是 从 
同 的 运算 数 。 


JE xz 日 二 
肯定 是 个 入 

















+2 











为 3， 那么 N 




















的 算术 表达 式 ， 而 且 在 时 间 t 它 正好 具有 不 








上 表达 式 3+2 同样 的 值 ， 








不 多 也 不 少 。 


























口 ”最 后 要 说 明 的 是 ， 这 些 代数 运算 符 
UPDATE (和 关系 赋值 ) 本 身 不 是 关系 代 
运算 符 。 虽 然 有 时 令 人 司 恼 











上 
号 




















(当然 , 实际 上 INSERT、DELETE 、UPDATE 和 
符 都 是 只 读 的 。) 








位- 
大- 











然而 我 曾经 说 过 ， 代 数 运算 


限制 








4.2 


现 厂 
查询 ， 查 询 1: 
件 重量 单位 为 磅 

查询 1: P WH 























从 零件 库 中 查询 零件 重量 小 于 12.5 
沉 ， 记 录 在 关系 变量 P 中 。 


ERE WEIGHT < 12.5 
























































查询 1 的 运行 结果 
COLOR 


表 4-1 
PNO 


的 是 , 你 可 能 偶尔 遇 到 与 标识 相反 的 一 


E 开 始 更 详细 的 讨论 代数 运算 符 ,我 们 从 限制 (restrict) 开始 。 


查询 1 的 结果 如 表 4-1 所 示 ， 这 个 结果 是 从 样 


也 都 是 只 读 的 ，INSERT、DELETE、 


J 于 z 日 


肯定 是 关系 
些 语句 。 


都 是 修改 运算 符 ， 


数 运 算 符 ， 虽 然 它 们 


























关系 赋值 











考虑 下 面 这 个 
(这 里 假设 ， 零 











自 


/区 \o 





< 


磅 的 零件 信 





) 下 面 是 TutorialD 的 查询 公式 : 


本 数据 中 得 到 的 !。 


WEIGHT CITY 





Red 
Blue 


P1 
Pp5 





正如 你 所 看 到 的 ， 查询 结果 是 一 个 关系 。 而 且 ， 结 果 关 系 的 标题 























说 了 ， 因 为 (在 
I 相反 的 情况 ， 我 会 特别 说 明 。 


1 我 不 会 一 直 这 样 
书 的 例子 ， 除 非 ? 




















第 1 章 中 已 经 重复 了 ) 我 将 使 


12.0 London 


12.0 Paris 








与 输入 关系 的 





-HP 
由 分 





图 1.1 给 出 的 样 不 本 








本 数据 作 大 











4.3 投影 43 














标题 是 一 样 的 (例如 ， 零 件 关 系 就 是 关系 变量 P 的 当前 值 ) ， 结 果 关 系 的 内 容 由 满 
足 限制 条 件 WEIGHT < 12.5 的 特定 元 组 组 成 。 








下 面 给 出 限制 运算 符 的 准确 定义 。 



































定义 : r 是 一 种 关系 ，bx 是 + 的 限制 条 件 ( 例 如 ， 布 尔 表 达 式 中 每 个 属性 引用 














都 标识 了 r 的 某 些 属性 ， 





























口 ”这 个 定义 暗含 一 个 术语 限 
































而 不 是 任何 的 关系 变量 引用 ) 。 那 么 表达 式 WHERE bx 

的 意思 是 要 根据 限制 条 件 bx 从 7 中 取 值 ， 然 后 返回 一 个 关系 ， 它 和 > 其 有 相同 的 

标题 ， 但 是 内 容 由 表达 式 bx 判断 为 真 的 那些 元 组 组 成 。 
从 这 个 定义 中 又 引出 以 下 几 点 : 
























































































































































判 条 件 〈restrictiiomn condition) ， 它 是 一 个 布尔 表 
达 式 ， 每 个 属性 引用 都 确定 与 相应 关系 中 的 某 些 属性 
变量 引用 。 (注意 ,例子 中 的 布尔 表达 式 真 正 是 使 用 这 个 定义 给 出 的 限制 


一 致 。 并 且 没有 关系 


条 件 。) 就 像 你 已 经 意识 到 的 那样 ， 布 尔 表达 式 的 形式 如 此 简单 ， 可 以 说 
在 某 种 程度 上 是 因为 可 以 使 用 相应 关系 中 的 特定 元 组 来 孤立 地 判断 , 而 没 























有 必要 去 检测 习 




















个 关系 中 的 其 他 元 组 , 也 没有 必要 去 检测 其 他 关系 。 例 如 





限制 条 件 WEIGHT < 12.5 就 可 以 只 在 零件 关系 中 孤立 地 判断 是 真 还 是 假 

















口 ”再 重复 一 次 ，|1 






































WHERE 子 句 表 示 的 布尔 表达 式 被 假设 为 一 个 限制 条 件 。 


>» 


o 


然而 ， 为 方便 用 户 ， 在 实际 的 语言 中 (包括 Tutorial D 和 SQL) 通常 允许 
WHERE 子 句 包含 比 这 个 更 通用 的 布尔 表达 式 ， 例 如 本 章 后 面 给 出 的 例子 。 





注意 : 采用 这 和 


















































中 方式 简化 约束 条 件 是 合法 的 ， 因 为 如 果 exp 是 一 个 

















r 


WHERE bx 组 成 的 表达 式 ， 但 bx 本 身 不 是 一 个 限制 条 件 ， 那 么 exp 就 可 
以 等 价 于 某 个 更 为 复杂 的 表达 式 , 在 该 表达 式 中 涉及 的 任何 限制 都 确实 完 


全 遵守 了 这 个 约定 。 
J 它 同时 也 遵守 了 这 个 定义 , 即 限制 操作 的 结果 类 型 总 是 与 输入 的 类 型 相同 
(因为 它们 都 具有 相同 的 标题 〉。 






























































会 与 SQL 中 的 





4.3 投影 


现在 我 们 讨论 投影 











”限制 有 时 被 称 为 选择 (selection〉， 但 是 后 者 遭 到 了 轻微 的 反对 ， 























因为 它 


SELECT 操作 混淆 (参见 本 书 第 三 部 分 ) ， 同 时 也 会 与 关 
系 模型 中 的 选择 运算 符 混淆 (参见 第 7 章 ) 。 











(project) 。 考 虑 下 面 的 查询 ， 查 询 2: “对 于 每 个 零件 ， 





























要 获得 它 的 零件 号 、 颜 色 和 城市 ”。 这 里 给 出 TutorialD 的 定义 : 











查询 2 的 运行 结果 ， 








查询 2: PP { PNO ，COLOR ，CITY } 


如 表 4-2 所 示 。 





表 4-2 查询 2 的 零件 库 投影 运行 结果 

PNO COLOR CITY 
Pl Red London 
P2 Green Paris 
P3 Blue Oslo 
P4 Red London 
RS Blue Paris 
P6 Red London 

















正如 您 所 看 到 ,该 查询 的 运算 结果 仍然 是 一 个 关系 。 它 的 标题 由 在 投影 运算 中 
指定 的 属性 组 成 ， 它 的 内 容 由 相应 输入 的 子 元 组 的 值 组 成 。 

为 了 说 明 另 外 一 个 观点 ， 下 面 给 出 另外 一 个 例子 。 碍 询 3 是 “当前 零件 中 颜色 
和 城市 的 组 合 是 什么 ? ”， 这 里 给 出 Tutorial D 的 定义 : 

查询 3: P { COLOR ，CITY ]} 

运行 结果 ， 如 表 4-3 所 示 。 

































































表 4-3 查询 3 的 运行 结果 
COLOR CITY 
Red London 
Green Paris 
Blue Oslo 
Blue Paris 








这 个 例子 表明 ， 运 行 结果 的 度 为 4， 不 是 6。 即 使 原来 的 输入 中 有 6 个 元 组 ， 但 这 
6 个 元 组 中 的 3 个 元 组 都 包含 了 同样 的 颜色 和 城市 属性 组 合 。 现 在 ， 我 们 想 要 的 结果 是 
一 个 关系 〈 例 如 ， 我 们 想 要 保存 闭 包 属性 ) ， 定 义 中 的 关系 不 包含 重复 的 元 组 ， 因 而 ， 
具有 相同 颜色 和 城市 属性 组 合 的 3 个 元 组 只 保 留 一 个 即 可 。 换 名 话说 ，“ 消 除 重复 性 ”。 
题 外 话 : 这 个 例子 中 最 后 剩 下 的 属性 是 “全 码 ”， 即 唯一 的 码 由 整个 标题 组 成 
(注意 图 中 双 下 划 线 的 属性 ) 。 进 一 步 的 讨论 请 参看 第 $ 章 的 练习 5.1。 
























































顺便 说 一 下 ,前面 例子 中 的 消除 重复 性 在 直觉 上 感觉 是 合情合理 的 ， 从 则 辑 上 
来 说 是 正确 的 。 再 考虑 一 下 原来 的 查询 “当前 零件 中 颜色 和 城市 的 组 合 是 什么 ? ” 
“red 和 London” 这 个 组 合 肯定 是 存在 的 ， 它 实际 出 现 了 是 3 次 ， 但 这 个 查询 没有 问 
组 合 出 现 的 次 数 ， 只 问 了 组 合 是 否 存 在 。 所 以 针对 问题 “x 存在 吗 ? ”的 正确 的 答 


a wr 1 
案 是 yes 或 者 xzo， 而 不 是 数量 。 






























































































































































1 当然 ， 如 果 我 们 想 要 数量 的 话 ， 也 可 以 询问 数量 ， 但 这 将 是 另外 一 个 不 同 的 查询 ， 我 将 在 第 5 音 贡 
解 如 何 实现 这 种 查询 。 





























a 





























注意 : 从 理论 上 讲 ， 消 除 重 复 性 在 前 面 的 投影 例子 
影响 。 没 有 任 伍 ee 








码 ) 。 超 越 自 己 一 下 ， 至 少 我 再 增加 


























为 处 理 代数 运算 过 程 的 一 部 分 而 存在 。 然而 交际 上 需要 消除 重复 性 的 运算 符 只 有 
绍 ) 。 




















投影 运算 和 并 运算 将 在 本 章 后 面 介 
下 面 是 投影 运算 符 的 定义 。 



































定义 : 关系 ”具有 属性 47, 42, …， 
式 r{41，A42，...，An} 的 含义 是 在 {41，A42， 











An〔 也 可 以 采用 其 他 形式 表示 )。 
… An} 上 进行 7 的 投影 ， 返 





， 即 消除 重复 性 。 消 除 重复 4 


4.3 





投影 





示 上 是 唯 


45 


P 也 执行 了 ， 但 是 没有 任何 
FPF 包含 了 码 ( 实 陪 


的 











怕 








FE 一 直 作 
































对 于 该 定义 强调 以 下 几 点 : 


有 具有 标题 147，42，.…，4 中 ， 内 容 包含 所 有 
中 存在 这 样 的 元 组 ， 它 和 1 具有 相同 的 属性 值 。 


























口 ”当然 , 在 投影 操作 中 属性 的 说 明 顺序 是 没有 关系 的 。 这 是 因为 属 怕 














因此 是 可 以 相互 蔡 代 的 。 


P ECOEOR- 7 CLTY } 





P { CITY , COLOR } 

















口 ”为 方便 用 户 ，Tutorial D 允许 在 投影 操作 中 采用 
以 此 来 替代 保留 下 来 的 属性 。 例 如 ， 本 章 讨 论 的 











Tutorial D 的 方式 表达 : 





表 封 闭 在 大 括号 中 :。 例 如 ， 下 面 这 两 个 表 


P { ALL BUT PNAME , WEIGHT } 





P { ALL BUT PNO , PNAME ， 














达 式 从 迪 辑 上 来 说 是 等 




















WEIGHT } 











注意 : Tutorial D 人 允许 在 整个 语言 中 使 











) 。 在 VAR 语句 中 定义 了 关系 变量 SP， 


代替 了 KEY {SNO,PNO}。 





























例如， 我 们 





口 “ 投 影 运 算 结果 的 类 型 是 RELATION H， 标 题 了 


性 组 成 。 注 意 : 实际 上 任何 关系 操作 的 结果 类 型 总 是 








个 可 以 应 用 的 标题 。 因 而 ， 我 不 想 更 明 胡 





再 谈 闭 包 





考虑 下 面 的 查询 , 查询 4:“ 查询 零件 关系 中 零件 重量 小 于 12.5 的 零 们 












































颜色 和 城市 ? ”。 这 里 给 出 Tutorial D 的 定义 : 




















1 至 少 这 是 正规 的 语法 。 在 非 正规 的 形式 











在 {SNO} 上 的 S 的 投影 )。 


Pp， 
























































那么 表达 
器 的 关系 
的 元 组 tf， 元 组 满足 如 下 条 件 ， 即 在 x 


E 名 的 列 


价 的 ， 


删除 属性 的 方式 来 表达 ， 





j 这 个 类 型 〈 不 管 它 在 实际 上 是 


否 有 


两 个 投影 ， 可 以 采用 


Se 















































执行 投影 操作 的 那些 





| 局 


KEY {ALL BUT 








过 








省 略 括号 ， 只 写 出 “在 SNO 上 的 S 的 投影 





标题 H H, 这 里 HH 是 
外 地 来 指明 这 个 事实 。 


F 的 号 码 、 


”( 赫 代 














查询 4: ( P WHERE WEIGHT < 12.5 ) { PNO ,§ COLOR , CITY } 
运行 结果 如 表 4-4 所 示 。 











表 4-4 查询 4 的 运行 结果 
PNO COLOR CITY 
Pl Red London 
Pp5 Blue Paris 





注意 圆 括号 的 用 法 , 它 规定 了 要 先 判断 子 表达 式 P WHERE WEIGHT < 12.5( 它 
是 一 个 限制 条 件 ) 。 这 个 限制 的 结果 就 是 在 属性 PNO、COLOR 和 CITY 上 投影 。 
因此 ， 这 里 又 一 次 使 用 了 闭 包 ， 限制 的 结果 还 是 一 个 关系 ， 所 以 在 其 上 执行 投影 是 
合法 的 。 

这 个 例子 也 表明 , 当 我 们 说 (就 像 定义 中 写 的 那样 ) 投 影 由 表达 式 r{41,42,.…， 
An} 说 明 ， 理 解 表达 式 中 的 符号 x 是 很 重要 的 。 因 为 表达 式 本 身 表示 了 一 个 关系 表 
达 式 ， 而 它 通 常 可 以 是 任意 复杂 的 。 当 然 ， 在 限制 rxr WHERE bx 中 的 符号 7 也 是 同 
样 的 。 在 关系 运算 符 的 任何 定义 中 ， 关 系 本 身 的 表示 都 是 这 样 。 











































































































4.4 练习 I 


4.1 我 们 可 以 有 正规 的 理由 解释 关系 中 不 允许 存在 重复 的 元 组 ， 你 能 列举 一 
些 实际 的 原因 吗 ? 

4.2 为 什么 把 关系 代数 称 为 “关系 代数 ”? 

4.3 下 面 Tutorial D 的 表达 式 的 含义 是 什么 ? 

aSP { SNO , PNO , QTY } 

b.P WHERE CITY = CITY 

c.P WHERE FALSE 































































































4.5 ”答案 


4.1 正规 的 理由 就 是 关系 的 内 容 被 定义 为 一 个 集合 ， 数 学 中 的 集合 不 允许 有 
重复 的 元 素 。 至 于 实际 的 原因 如 下 : 实际 上 有 很 多 ， 但 我 们 不 能 涉及 足够 多 的 基础 
原理 来 解释 大 部 分 的 原因 。 但 至 少 有 一 点 是 很 直观 的 ， 如 下 所 示 ': 假设 “关系 变 
量 ” 及 允许 重复 , 那么 我 们 就 不 能 说 出 R 的 真正 的 复制 品 和 偶然 关系 之 间 的 差异 ( 例 































































































[lm 








1 其 他 原因 将 在 附录 中 讨论 。 
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如 ， 因 为 用 户 错误 而 产生 的 关系 ) 。 我 们 也 不 能 轻易 删除 这 些 偶 然 的 关系 ， 即 使 我 
们 可 以 把 它们 识别 出 来 。 

还 有 另外 一 点 可 以 用 来 说 明 关 系 操作 的 结果 : 如 果 我 们 不 消除 这 些 结果 的 重复 
性 ， 那 么 这 些 结果 就 不 是 关系 ,我们 也 不 能 对 它们 执行 关系 操作 。 换 句 话说 ， 我 们 
破坏 了 闭 包 ， 我 们 也 不 能 写 出 正确 的 骨 套 表达 式 。 

4.2 这 是 一 个 很 复杂 的 问题 ， 我 认为 它 不 是 简单 的 或 者 简练 的 答案 '。 然 
而 ， 有 点 不 严格 地 讲 ， 代 数 可 以 被 定义 为 一 个 正规 的 系统 ， 它 包括 以 下 几 个 部 
分 : (a) 某 种 类 型 对 象 的 集合 ; (b) 只 读 运 算 符 的 集合 ， 运 算 符 可 以 作用 于 
这 些 对 象 ; (c) 这 些 对 象 和 运算 符 同 时 满足 特定 的 规则 和 特性 ， 比 如 闭 包 特 
性 (参见 附录 C) 。 单 词 “ 代 数 ” 本 身 就 来 源 于 阿拉 伯 语 al-jebpr， 意 思 是 重 置 
(可 能 某 些 东 西 被 破坏 了 ) 或 组 合 。 关 系 代 数 尤 其 能 把 前 面 有 限 松散 的 定义 组 
合 在 一 起 。 

4.3 a. 关系 变量 SP 的 当前 值 在 所 有 属性 上 的 投影 。 结 果 当 然 是 与 当前 值 完全 

相同 的 。 实 际 上 ， 其 在 所 有 属性 上 的 投影 又 被 称 作 恒 等 投影 。 
b. 这 个 表达 式 (当然 也 是 一 个 限制 表达 式 ) 返回 一 个 关系 ， 它 的 值 为 关系 变 
量 P 的 当前 值 ， 因 为 WHERE 子 句 中 的 布尔 表达 式 对 每 个 元 组 判断 后 都 为 TRUE。 
实际 上 ， 总 的 来 说 ， 限 制 表 达 式 逻辑 上 等 价 于 P WHERE TRUE。 注 意 : 逻辑 上 等 
价 于 > WHERE TRUE 的 任何 限制 表达 式 都 被 称 为 恒 等 限制 。 

c. 这 个 表达 式 〈 也 是 一 个 限制 表达 式 ) 返回 一 个 空 的 零件 关系 。 录 和 辑 上 等 价 
于 WHERE FALSE 的 任何 限制 表达 式 都 被 称 为 空 限制 。 


4.6 并 、 交 、 差 

现在 开始 讨论 并 (union) 、 交 (intersection) 、 差 (difference) 运算 ， 这 些 运 
算 符 都 遵循 同样 的 模式 ， 首 先 从 并 运算 开始 。 
4.6.1 并 

考 卡 下 面 的 查询 ， 查 询 $: “获得 至 少 一 个 供应 商 的 城市 或 者 一 个 零件 的 城市 
名 称 ”。 这 里 给 出 Tutorial D 的 定义 (注意 义 是 一 个 闭 包 ) : 
查询 5: S { CITY } UNION P { CITY } 
查询 5 的 运行 结果 如 表 4-5 所 示 。 







































































































































































































































































































































































1 事实 上 ， 关 于 这 个 问题 我 写 了 一 篇 论文 ， 即 Why Js 1t Called Relational 4Algebra ? 这 篇 论文 位 于 我 的 
一 本 书 中 Logic and Databases: The Roots of Relational Theory (2007 年 ， 特 拉 福 德 )。 











表 4-S 查询 5 的 运行 结果 
CITY 
Athens 
London 
Oslo 
Paris 








正如 你 所 看 到 的 ， 这 个 结果 仍然 是 一 个 关系 。 它 的 标题 与 两 个 输入 关系 的 标题 
相同 ， 它 的 内 容 包括 了 这 两 个 关系 中 的 一 个 或 两 个 〈 同 样 要 消除 重复 的 元 组 ) 。 注 
意 : 这 两 个 输入 关系 必须 具有 相同 的 标题 〈 等 价 地 ， 它 们 必须 具有 相同 的 类 型 ) ， 
否则 将 不 能 进行 并 操作 。 但 是 如 果 它 被 定义 了 ， 那 么 结果 也 应 该 具有 和 输入 同样 的 

下 面 是 另外 一 个 例子 可 以 来 说 明 这 一 点 。 假 设 零件 具有 另外 一 个 属性 
STATUS， 类 型 为 INTEGER， 考 虑 查询 “获得 至 少 一 个 供应 商 或 零件 的 城市 和 状 
态 ”。 这 里 给 出 Tutorial D 的 定义 : 


9 { STATUS , CITY } UNION P { CITY , STATUS } 


然 , 这 个 例子 按照 从 无 到 右 的 顺序 说 明 属性 , 也 是 与 标题 中 说 明 的 顺序 无 关 



































































































































I 

















的 。 

下 面 给 出 并 运算 的 定义 。 

定义 : 关系 rl 和 x2 具有 同样 的 类 型 7， 那 么 表达 式 r1 UNION 72 的 含义 是 求 
出 x7 和 x2 的 并 集 。 它 返回 一 个 类 型 为 了 的 关系 ， 它 的 值 或 者 出 现在 r1, 或 者 出 现 
在 r2?， 或 者 同时 出 现在 x7 和 x2 中 的 所 有 元 组 i。 


4.6.2 交 


交 运 算 做 必要 的 修正 后 与 并 运算 非常 相似 。 尤其 是 这 两 个 输入 关系 又 必须 是 相 
同 的 类 型 ， 结 果 也 是 相同 的 类 型 。 下 面 是 一 个 查询 的 例子 ， 查 询 6: “查询 至 少 包 
含 一 个 供应 商 和 一 个 零件 的 城市 ”， 这 里 给 出 TutorialD 的 定义 : 
查询 6: 5S { CITY } INTERSECT P { CITY } 
查询 6 的 运行 结果 如 表 4-6 所 示 。 



































































































































表 4-6 查询 6 的 运行 结果 
CITY 


London 





Paris 
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下 面 给 出 交 运算 的 定义 。 

定义 : 关系 rl 和 x2 具有 相同 的 类 型 7， 那么 ， 表 达 式 r7 INTERSECT 72 的 含 
义 就 是 求 出 r7 和 2 的 交集 , 返回 结果 的 关系 类 型 为 了, 内容 为 同时 出 现在 r7 和 x2 
中 的 所 有 元 组 t。 


4.6.3 差 


差 运算 〈 在 Tutorial D 中 为 MINUS) 与 并 运算 也 有 一 些 相似 。 特 别 是 这 两 个 
运算 的 输入 也 要 求 是 同一 种 类 型 , 输出 结果 也 是 同 种 类 型 .下面 给 出 一 个 查询 例子 ， 
查询 7: “查询 至 少 包含 一 个 供应 商 , 但 不 包含 零件 的 城市 ”， 这 里 给 出 Tutorial D 
的 定义 : 
查询 7: S { CITY } MINUS P { CITY } 
查询 7 的 运行 结果 如 表 4-7 所 示 。 
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表 4-7 查询 7 的 运行 结果 
CITY 
Athens 
然而 ， 差 运算 与 并 运算 和 交 运 算 有 一 点 不 同 ， 即 差 运算 要 考虑 运算 数 的 顺序 。 












































在 并 运算 中 ，1J UNION 1/2 和 m2 UNION 17 是 等 价 的 。 同样 在 交 运 算 中 ， 放 7 
INTERSECT xr2 和 x2 INTERSECT rl 也 是 等 价 的 。 但 是 r1 MINUS 以 与 12 
MINUS x7 表示 的 不 是 同一 件 事情 ， 即 使 它们 返回 结果 的 类 型 是 一 样 的 (返回 结果 
相等 当 且 仅 当 x 和 x2 相等 时 ， 或 者 二 者 都 是 空 集 ) 。 下 面 给 出 一 个 例子 。 

查询 8: P { CITY } MINUS S { CITY } 

查询 8 的 运行 结果 如 表 4-8 所 示 。 















































表 4-8 查询 8 的 运行 结果 
CITY 
Oslo 





下 面 给 出 差 运算 的 定义 。 

定义 : 关系 rl 和 x2 具有 相同 的 类 型 7T， 那 么 ， 表 达 式 r1 MINUS 72 表示 求 出 
志和 72 的 差 (严格 按照 rl 和 x2 的 定义 顺序 ) ， 返 回 结果 的 关系 类 型 为 7， 内 容 为 
同时 出 现在 rl 但 没有 出 现在 ”2 中 的 所 有 元 组 t。 


















































4.6.4 

并 运算 尤其 
化 的 查询 任务 
(commutative ) 的 含义 就 是 r7 U 
一 个 事实 ， 即 运算 符 中 r7 和 x2 






































一 些 公式 化 的 特 
具有 很 多 吸引 人 的 公式 化 的 特性 , 这 些 特性 可 以 帮助 
。 特 别 说 明 ， 该 运算 符 具 有 交换 性 、 结 合 性 血 等 性 。 交 换 性 
INION 72 和 xr2 UNION 77 是 等 价 的 《〈 这 个 特性 遵循 这 样 
的 定义 是 对 称 的 ) 。 因 此 ， 就 像 前 面 已 经 说 明 的 那样 ， 该 


全 















































户 完 成 很 多 公式 


运算 符 中 的 运算 数 的 顺序 是 没有 规定 的 。 结合 性 (associative) 的 含义 就 是 r1 UNION (12 














UNION xr3) 与 (x1 UNION r2) UNION 73 是 等 价 的 , 所 以 表达 式 中 不 需要 圆 括号 ,可 以 简 
化 为 r1 UNION r2 UNION r3。 窜 等 性 〈idempotent) 的 含义 是 UNION 7 与 r 等 价 。 


上 面 这 段 论述 的 特性 100% 适 用 于 交 运 算 。 也 就 是 说 ， 交 运算 也 
晶 是 ， 这 三 条 特性 都 不 适 月 








结合 性 、 突 等 性 。 


4.7 改名 




















考虑 下 面 这 个 查询 ， 





《这 个 查询 是 人 为 设计 的 ， 也 许 不 能 凭借 直观 的 感觉 来 进行 ， 但 是 它 满足 了 我 要 在 

















“至 少 获得 


日 于 差 运 

















具有 交换 性 、 














算 。 























一 个 与 所 给 名 字 一 致 的 供应 商 名 或 零件 名 











这 里 讨论 的 问题 的 要 求 。) 下面 这 个 规范 化 的 查询 是 不 能 执行 的 : 


S { SNAME } UNION P { PNAME } 
不 能 执行 的 原因 是 并 运算 (UNION) 要 求 运 算数 必须 具有 相同 的 类 型 ， 
类 型 ， 也 要 具有 相同 的 名 字 。 





/ 











义 就 是 对 应 的 属性 不 仅 要 具 





有 相同 尼 

















地 说 ， 











共有 相同 的 类 型 ， 
范 查 询 ， 纯 粹 是 考虑 到 对 称 性 


G0- 
UNION 








(人 


它们 必须 具有 非常 一 致 的 属性 。) 
执行 并 运算 之 前 我 们 必须 至 少 给 SNAME 和 了 PNAME zZ 
但 显然 它们 有 具有 不 同 的 名 字 ) 。 








P RENAME { PNAME AS NAME } ) 





因此 ， 




















{ NAME } ) 





因此 ， 下 
的 原因 ， 我 把 两 个 相应 


S RENAME { SNAME AS NAME } ) { NAME } ) 




















(事实 上 ， 
在 目前 情况 下 , 为 了 满足 这 个 需求 
进行 改名 (这 些 属性 至 少 





卡 
规范 





929 
o 





含 
蕊 














的 属性 都 改名 为 同样 的 名 














面 是 一 个 可 以 执行 的 规 


字 。 


在 详细 解释 这 个 规范 的 查询 如 何 执行 之 前 (如果 你 自己 还 没有 和 弄 明 白 是 怎么 回 








al 





于) ， 我 们 先 来 讨论 一 


下 RENAME 运 算 























定义 : 关系 > 











1 它们 也 可 以 帮助 优化 器 ， 





























但 详细 的 讨论 优化 器 不 是 本 书 的 主要 
2 你 可 能 已 经 注意 到 图 4.1 中 没有 给 出 RENAME， 实 际 上 它 不 是 
Codd 从 没有 正确 思考 过 像 UNION 这 样 的 运算 符 如 何 工作 的 具 











符 本 身 “。 下 面 给 出 它 的 定义 。 
有 属性 4， 不 具有 属性 B， 那 么 表达 式 r+ RENAME {4 AS 8} 














的 。 












































Codd 的 原始 运算 符 之 
体 细节。 





Ne 
。 过 十 














4.7 改名 51 


将 返回 一 个 与 上 具有 相同 标题 的 关系 , 除了 将 属性 4 改名 为 属性 B 之 外 ,内容 也 与 





r 相同， 除了 对 
下 面 给 出 一 个 例子 。 
查询 9: S RE 
































时 性 4 的 引用 蔡 换 为 对 





属性 B 的 引 月 





EE { CITY AS SCITY } 





昌之 外 。 








市 属性 改名 为 SCITY 以 外 ) 。 





查询 9 的 运行 结果 如 表 4-9 所 示 〔 它 和 通常 的 供应 商 关 系 














样 的 ， 除 了 将 城 
































表 4-9 查询 9 的 运行 结果 
SNO SNAME STATUS SCITY 
Sl Smith 20 London 
S2 Jones 10 Paris 
S3 Blake 30 Paris 
S4 Clark 20 London 
S5 Adams 30 Athens 
强调 : 关系 变量 S 在 数据 库 中 是 没有 改变 的 ! 表达 式 S RENAME {CITY AS 





SCITY} 仪 仅 是 一 个 表达 式 〔 就 像 r17 MINUS 已 或 N+ 2 都 只 是 表达 式 一 样 ) ， 像 








可 以 嵌 套 在 其 








RENAME 


UNION 





解释 : 





任何 表达 式 一 样 ， 它 仅仅 代表 一 个 值 。 而 
也 的 表达 式 当 中 。 


























( ( P RENAME { 


E AS NAME } 


PNAME AS NAME } 

















{ NAME } 


为 它 是 表达 式 ,不 


用 JOIN 或 UNION 时 才 需 要 !。 
然 要 讨论 ， 但 是 首先 还 是 要 给 出 一 个 UNION 操 作 的 例子 。 


( ( S RENAME { SNAM { NAME } ) 








语句 ， 所 以 它 





) 





当然 JOIN 运算 的 细节 也 仍 


口 SRENAME {SNAME AS NAME} 这 个 子 表达 式 返 回 一 个 基本 上 与 关系 变 


量 S 的 当前 值 相 
们 把 结果 称 之 为 
































司 的 关系 ， 除 了 
r1。 关 系 r1 在 NAME 上 
口 P RENAME {PNAME AS NAME} 这 个 子 表达 式 返 回 
量 P 的 当前 值 相 
们 把 结 














属性 SNAME 被 改名 为 NAME 以 外 ， 我 








改 投 影 ， 过 








得 结果 为 关系 2。 











基本 上 与 关系 变 
的 关系 ， 除 了 属性 PNAME 被 改名 为 NAME 以外， 我 





尔 之 为 r3。 关 系 73 在 NAME 上 做 投影 ， 球 














得 结果 为 关系 74。 








口 ” 最后， 计算 表 达 式 r2 UNION r4， 得 到 的 结果 关系 度 为 1， 只 上 共有 一 个 属 





性 NAME (类 型 为 CHAR) ， 内 容 为 








1 它 在 联接 特定 外 人 码 时 也 会 需要 (参见 SOL and Relational Theory， 或 者 第 9 章 品 











练习 9.5 的 答案 ) 


S2 


4.8 


上 的 ， 按 照 你 对 它们 的 弄 
4.6 下面 Tutorial D 的 表达 式 的 含义 是 什么 ?注意 : 
中 ， 你 都 可 以 假设 TutorialD 的 投影 运算 在 所 有 的 关系 运算 符 中 优先 级 最 高 。 





| 


本 


TUPLE { NAME name } 























中 所 有 元 组 的 集合 。 这 里 的 name 表示 来 











于 关系 变量 S 的 属性 SNAME 的 当 



































前 值 ， 或 者 关系 变量 P 的 属 

















练习 II 








届 性 PNAME 的 当前 值 ， 或 者 二 者 都 有 。 





























4.4 为 什么 说 在 交 运 算 或 差 运 算 中 ， 消 除 重 复 性 不 算是 一 个 问题 ? 




















4.5 关系 型 的 并 、 

















aP { PNO } MINUS ( SP WH 

b.( Ss { CITY } INTERSECT 

c.S { SNO } MINUS ( 

d.SP MINUS SP 

e.S INTERSECT S 

f.( S WHERE CITY = ‘Paris’ ) 
4.7 ” 写 出 下 列 查 询 的 TutorialD 表达 式 : 

a. 查询 所 有 的 供应 关系 。 

b. 查询 由 供应 商 S2 供应 的 零件 号 码 。 


ERE 
P { 






























































UNION 
































交 、 差 运算 符 都 是 建立 在 集合 同名 运算 符 的 集合 理论 基础 
解 ， 请 给 出 这 些 集合 运算 符 精确 的 定义 。 
无 论 是 在 这 里 还 是 在 整 


























SNO 
CITY,  .) 


‘S2” ) { PNO } 
UNION P { CITY } 


S { SNO } MINUS SP { SNO } ) 





ERE 











( S WH STATUS = 20 ) 


Cc. 

















查询 状态 值 STATUS) 范围 在 15 至 25 之 间 的 供应 商 。 





d. 





查询 状态 值 (STATUS) 小 于 供 





应 商 S2 的 供应 商号 码 。 











e. 查询 所 有 供应 商城 市 为 Paris 的 供 
自己 设计 一 些 查询 ， 并 写 出 这 些 查 询 的 Tutorial D 表达 式 。 可 以 依据 你 
应 商 -零件 数据 库 。 





4.8 
自己 设计 的 数据 库 ， 或 者 依据 供 




















4.9 


答案 I 





应 商 供应 的 零件 号 码 。 











4.4 在 输入 关系 中 肯定 是 没有 重复 元 组 的 ， 
虑 INTERSECT r2, 这 是 一 个 不 太 严 格 的 定义 ， 
同时 7 了 也 要 出 现在 ”2 中 ,这 样 显然 就 消除 了 重复 4 
返回 ”7 中 的 最 大 子 集 >， 但 > 不 能 出 现在 ”2 中 ， 显 然 这 也 消除 了 重复 性 。 

b 么 在 集合 理论 中 4 和 B 的 并 集 就 是 至 少 出 现在 4 和 




















返 











4.5 A 和 B 都 是 集合 ， 








因为 输入 的 就 是 关系 。 接 下 来 考 
含义 是 返回 xr] 中 的 最 大 子 集 x， 
生 。 同 样 ，r7 MINUS x2 的 含义 是 















































B 中 之 一 的 所 有 元 素 组 成 的 集合 。A 和 B 的 交集 就 是 同时 出 现在 4 和 B 中 的 所 有 
元 素 组 成 的 集合 。4 和 B 的 差 集 就 是 出 现在 4 
































组 成 的 集合 。 进 一 步 的 讨论 可 以 参见 附录 C。 









































PF， 但 不 能 出 现在 B 中 的 所 有 元 素 


4.6 注意 : 下 面 给 出 的 表达 式 的 解释 说 明 都 是 故意 采用 不 规范 的 写法 来 进 





行 的 。 

















a. 查询 没有 由 供应 商 S2 提供 的 零件 号 码 。 
b. 查询 所 有 零件 所 在 的 城市 。 这 个 表达 式 总 的 来 说 将 零件 号 限定 在 P{CITY} 。 
注意 ， 这 个 练习 说 明了 吸收 律 (absorption laws) ， 我 再 强调 一 下 : 


























Zr2 
2 


rl INTERSECT r2 ) UNION r2 
rl UNION r2 ) INTERSECT r2 


“=” 表 示 恒 等于 。 














( 
( 
符 








Cc. 
d. 获得 供应 关系 的 空 集 。 
e， 查询 所 有 的 供应 商 。 

















号 
查询 至 少 提供 1 个 零件 的 供应 商号 码 。 














f， 查询 满足 供应 商城 市 为 Paris 或 者 状态 值 为 20 的 供应 商 。 


4.7 下 面 给 出 的 答案 不 是 唯一 的 : 
a. SP。 

















b. ( SP WHERE SNO = ‘S52 ) { PNO }。 














c. S WHERE STATUS 之 15 AND STATUS 
































子 句 中 的 布尔 表达 式 允 许 使 用 逻辑 运算 符 AND、OR 及 NOT。 




















d. ( S WHERE STATUS < STATUS FROM 
( TUPLE FROM 














( S WHERE SNO = ‘S2’ ) ) ) { SNO } 


三 25。 这 个 答案 表明 ，WHERE 


对 这 个 表达 式 的 解释 如 下 ， 虽 然 下 面 的 解释 有 些 不 规范 。 第 一 ， 这 一 点 以 前 我 
们 已 经 说 明 过 ， 即 在 Tutorial D 中 ，WHERE 子 句 中 的 布尔 表达 式 可 以 仅仅 是 一 个 




















简单 的 限制 条 件 〈 或 者 可 以 更 复杂 ) ; 第 二 ， 
SNO='S2' 的 值 为 只 包含 一 个 元 组 的 关系 , 但 是 它 
































能 套 最 深 处 的 子 表达 式 S WHERE 
仍然 是 关系 ， 我 们 需要 的 不 是 关系 


本 和 喘 ， 而 是 包含 在 这 个 单个 元 组 关系 中 的 单个 元 组 的 状态 值 (status〉， 所 以 我 们 





























首先 需要 使 用 TUPLE FROM 从 那个 关系 中 抽取 出 相应 的 元 组 〈 这 是 一 个 运算 符 ， 
可 以 从 只 包含 一 个 元 组 的 关系 中 抽取 出 唯一 的 元 组 ) ， 然 后 需要 使 用 STATUS 


























FROM (通常 ， 运 算 符 “altripute name FROM 
个 元 组 中 抽取 出 特定 的 属性 值 ) 从 那个 元 组 上 
个 状态 值 ( 用 x 标识 ) 就 是 供应 商 S2 的 状态 值 ， 因 此 这 个 表达 式 就 简化 为 限 秆 


























达 式 S WHERESTATUS<x。 














抽取 出 相应 的 状态 值 (status〉。 














”可 以 完成 从 元 组 表达 式 1 说明 的 那 


这 


小 


CE 
六 层 : 


的 注释 中 给 出 。 


e.WITH ( 





商 ， 刀 


一 行 是 要 求 求 


£1 


£2 
t3 
( P WHERE ( 


解释 如 下 : 





S WH 
eh 








XxX 


= PNO* ) 








ERE CITY = ‘Paris’ ， 
{ SNO } ， 
:= SP RENAME { PNO AS x } 


t3 WHERE { SNO }Ot2) 





首先 ，WITH 本 身 不 是 
达 式 命名 ， 在 某 种 程度 
应 商号 码 ， 好 是 整 
H 表 达 式 P WHERE bx 的 值 











与 





























是 Paris 的 供 














子 集 ， 然 后 将 子 集 在 PNO 


先 它 涉 及 了 两 个 关系 之 间 的 比较 
它们 都 是 单个 属性 ， 并 | 
系 r2 就 是 2， 即 Parzs 的 供应 商号 码 。 至 于 关系 7， 其 实 


而 且 ， 











个 运算 符 


宪 个 供 


三 | 
只 是 


能 能 金 让 我 们 既 看 到 桂林 ， 又 看 到 森林 。 
应 关系 ， 但 是 


种 句法 的 小 把 戏 ， 目 


{ PNO } 








的 是 帮 我 们 给 子 表 





这 个 练习 题 还 有 另外 一 种 答案 ， 在 本 章 4.12 节 “ 修 改 运算 符 说 明 ” 中 





人 














因而 ， 刀 























>» 换 句 话说 ， 


是 要 把 PNO 改 名 为 x。 











是 Paris 的 供应 
然后 ， 最 后 





| 








它 要 从 零件 关系 中 








加 进行 投影 ? 返 
































个 独立 的 事 
件 元 组 用 bp 表示 ， 那 么 rl 实际 | 
px 都 要 判断 供应 零件 
Paris 所 有 供 
当然 ， 如 果 不 想 使 





价 于 前 
(P WHERE ( (SP RENAME{PNO AS x}) 
((S WHERE CITY="Paris’) 

注意 : 
为 〈 就 像 本 
一 个 大 的 表达 
4.8 


因 











情 ) ， 











所 的 作 


因为 实际 J 








应 商 是 





否 是 Paris 


上 9 





希望 得 至 
(分 别称 之 为 ri 和 72) 
日 相同 ， 都 为 SNO ( 


F 它 要 依赖 于 我 们 要 讨 
上 就 是 供应 零件 的 供 























应 商 提供 的 零 





a 























面 给 出 的 形式 。 


| 


书 第 三 部 分 











几 


4.10 联接 


我 想 讨论 的 Codd 原始 运 
我 把 它 放 在 了 最 后 ， 





1 关系 型 的 比较 将 石 





但 它 还 是 最 





} 介 绍 的 一 相 
式 分 解 为 了 零散 的 小 的 表达 式 。 





= 


牛 就 是 我 们 想 要 获得 
WITH 也 可 以 。 下 面 Tutorial D 的 表达 式 在 逻辑 


W. 














站 


符 集合 


的 。 








SQL 中 支持 WITH 结构 ， 但 是 它 不 像 Tutorial D 中 的 结 
FE) SQL 的 这 种 句法 结构 不 





的 下 一 





挑选 出 特定 的 








| 的 零件 号 。 人 至 于 布尔 表达 式 bx， 首 
'。 注 意 这 两 个 关系 的 度 都 为 1， 
因而 ， 它 们 都 具有 同样 的 类 型 ) 。 




















关系 的 元 组 。 





关 





民 本 没有 引用 到 过 (好 像 它 是 一 
论 的 零件 





如 果 我 们 把 零 





应 商号 但 ， 因 
的 子 集 。 如 果 zx 为 TRUE 





HERE x=PNO) 











而 ， 对 本 


每 一 个 零件 p， 
， 就 说 明 由 














{SNO1 之 
{SNO} ) ) {PNO} 





上 就 等 























构 一 样 有 用 。 





























有 








个 运算 符 就 是 联接 


易 读 性 ， 它 把 


(join) 。 尽 管 


下 














重要 的 


FE 本章 后 面 详细 讨论 。 


个 。 首 先 从 一 个 查询 例子 





始 ， 查 询 10: 

















SP JOIN S 






































查询 10 的 运行 结果 如 表 4-10 所 示 。 


4.10 联接 55 








“对 于 每 一 种 供应 商 关 系 ， 碍 询 零 件 号 码 、 数 量 和 对 应 的 供应 商 的 详细 信息 ”。 


Tutorial D 的 定义 非常 简单 : 


























表 4-10 查询 10 的 运行 结果 

SNO SNAME STATUS CITY PNO QTY 
Sl Smith 20 London Pl 300 
Sl Smith 20 London P2 200 
Sl Smith 20 London P3 400 
Sl Smith 20 London P4 200 
Sl Smith 20 London PS 100 
Sl Smith 20 London P6 100 
S2 Jones 10 Paris Pl 300 
S2 Jones 10 Paris P2 400 
S3 Blake 30 Paris P2 200 
S4 Clark 20 London P2 200 
S4 Clark 20 London P4 300 
S4 Clark 20 London PS 400 

解释 如 下 : 

















运算 数 关系 中 的 唯 


















































下 面 的 定义 将 会 让 你 更 清楚 ，TutorialD 的 联接 运算 是 在 
























































共有 值 为 s， 每 个 S 中 的 元 组 刀 的 SNO 都 
























































有 公共 属性 的 基础 








上 执行 的 。 在 目前 的 情况 下 ， 联 接 运算 是 在 供应 商号 码 的 基础 上 执行 的 ， 作 为 两 个 
属性 的 SNO 是 公共 的 。 因 而 ， 每 个 SP 中 的 元 组 万 的 SNO 都 
有 相同 的 值 *， 然 后 得 到 如 表 4-10 所 





示 的 结果 。 当然， 实际 上 对 于 任何 给 定 的 嫌 ， 都 恰好 有 这 样 的 一 个 刀 ， 因 为 唯一 


公共 的 属性 SNO 构成 了 SP 日 
S5 的 元 组 11， 那 么 结果 
属性 SNO 在 结果 








条 




















关系 rl 和 xr2 是 可 以 联接 的 ， 当 























的 外 码 ， 而 且 是 S 























也 不 会 包含 人 





























就 是 它们 恰好 具有 非常 相同 的 属性 。- 





1 忽略 它 的 名 字 ， 联 接 能 力 的 概念 不 仅 可 以 应 


章 讨论 这 些 。 





的 目标 码 。 如 果 不 存在 SNO 值 为 




















t 应 商号 S5 的 元 组 。) 也 要 注意 的 是 ， 公 共 
只 能 出 现 一 次 ， 不 能 出 现 两 次 。 
在 我 给 出 联接 运算 本 身 的 定义 之 前 ， 介 绍 一 下 联接 能 力 〈joinability) 的 概念 。 
且 仅 当 它们 同名 属性 的 类 型 也 是 相同 的 时 候 ， 








Sh 
意思 














下 面 给 出 联接 运算 的 定义 〈 注 











到 联接 运算 中 ， 也 可 以 应 


























我 们 也 可 以 采 


























:合并 运算 时 




















它们 的 标题 是 合法 的 标题 。 








FE 意 : 它 揭示 了 


] 到 其 他 运算 中 ， 将 在 第 5 








] 另 外 一 种 方式 来 定义 : 关系 fl 和 了 z2 是 可 以 联接 的 ， 当 且 仅 当 在 进行 





标题 和 元 组 都 是 集合 ， 





定义 : 关系 六 和 rx2 是 可 以 联接 的 ， 那 么 表 
它 返 回 一 个 关系 ， 标 题 为 rl 和 r2 标题 
慌 的 所 有 元 组 1 的 集合 。 

联接 (join) 代替 了 


和 72 的 联接 运算 ， 





元 组 与 r2 中 的 元 组 求 得 的 并 重 
= yg 我 用 缩写 词 
个 查询 例子 ， 查 询 11: 





这 里 应 该 提醒 























因此 可 在 集合 理论 运算 符 中 进行 操作 ， 比 如 ， 

















P JOIN S。 


























的 并 集 ， 














然 联接 。 









































并 运算 ) 。 





达 式 r7 JOIN 72 的 含义 是 进行 r] 
内 容 为 r7 中 的 





下 面 是 为 外 一 






































































































































按照 定义 的 形式 , 该 联接 将 在 零件 和 供应 商 关 系 的 城市 属性 上 进行 联接 , CITY 
就 是 P 和 S 中 唯一 公共 的 属性 ， 其 运行 结果 如 表 4-11 所 示 。 
表 4-11 查询 11 的 运行 结果 
SNO SNAME STATUS CITY PNO COLOR WEIGHT 
Sl Smith 20 London Pl Red 12.0 
Sl Smith 20 London P4 Red 14.0 
Sl Smith 20 London P6 Red 19.0 
S2 Jones 10 Paris P2 Green 17.0 
S2 Jones 10 Paris PS Blue 12.0 
S3 Blake 30 Paris P2 Green 17.0 
S3 Blake 30 Paris PS Blue 12.0 
S4 Clark 20 London Pl Red 12.0 
S4 Clark 20 London P4 Red 14.0 
S4 Clark 20 London P6 Red 19.0 
与 并 、 交 运算 一 样 ， 联 接 运 算 也 具有 交换 性 、 结 合 性 和 徊 等 性 。 
4.10.1 笛 卡 儿 乘 积 
通常 情况 下 ， 笛 卡 儿 乘积 (简称 为 乘积 ) 返回 一 个 关系 ， 该 关系 包含 所 有 可 能 
的 元 组 , 每 个 元 组 都 由 两 个 元 组 的 联接 运算 组 成 ,每 一 个 元 组 都 来 自 于 两 个 特定 的 
关系 。 现 在 假设 我 们 想 计 算 关 系 变 量 S 和 了 的 乘积 。 关 系 变 量 S 和 了 都 具有 属性 
CITY， 就 像 表 面 上 看 起 来 的 那样 ， 它 好 像 应 该 具有 两 个 CITY 属性 ， 但 那样 的 话 


结果 就 不 是 一 个 关系 了 。 回 顾 第 2 章 ， 





的 属性 
足 的 ， 


出 现 。 因 
因 


























然而 ， 为 了 不 使 用 RENAME 运算 符 ， 














查询 12: 


S { SNO } TIMES 


表 4-12 中 没有 列 出 全 部 的 运行 结果 (全 部 运 





“查询 当前 所 有 的 供 





P { PNO } 


应 商号 和 零件 号 ”。 























关系 中 的 标题 不 允许 有 同一 名 字 的 两 个 不 同 
因此 ， 乘积 的 输入 关系 不 能 有 相同 的 属性 (通常 
为 可 以 借助 于 RENAME 运算 符 ) 。 











这 个 条 件 都 是 能 够 满 





我 们 来 考虑 一 下 下 面 这 个 简 自 





下 面 给 








的 查询 ， 











出 Tutorial D 的 定义 : 


行 结果 有 30 个 元 组 ) 。 
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表 4-12 查询 12 的 部 分 运行 结果 
SNO PNO 
Sl Pl 








下 面 给 出 乘法 运算 符 的 定义 。 
定义 : 关系 r] 和 7r2 没有 公共 属性 ， 那 么 表达 式 r1 TIMES r2 表示 rl 和 +2 


的 乘积 。 

7 中 

集合 。 
下 









































结果 会 返回 一 个 关系 ， 该 关系 的 标题 是 r1 和 xr2 标题 的 并 集 ， 内 容 为 
的 一 个 元 组 和 xr2 中 的 一 个 元 组 求 集 合并 集 后 构成 的 一 个 新 元 组 上 的 


I 
































1 你 所 看 到 的 ， 这 个 定义 与 我 给 出 的 联接 运算 的 定义 是 相同 的 ， 除 了 rl 和 





























72 是 可 以 联接 的 这 个 条 件 以 外 , 这 里 需要 上 和 72 不 能 有 公共 属性 。 但 是 稍 等 一 下 ， 









































可 联接 的 只 是 意味 着 具有 相同 名 字 的 属性 必须 具有 相同 的 类 型 。 但 是 如 果 没 有 任何 










































































名 字 ， 蛋 


























属性 具有 相同 的 名 字 ， 那 么 这 个 条 件 很 容易 满足 ! (如 果 没 有 任何 属性 具有 相同 的 









































b 么 肯定 不 存在 具有 相同 名 字 的 属性 ， 它 们 不 具有 相同 的 类 型 。〉 因 而 ,x1 






























































和 2 不 具有 公共 属性 只 是 rl 和 x2 可 联接 的 一 种 特殊 情况 ,TIMES 是 JOIN 的 一 种 

















特殊 情况 。 



































下 面 给 出 另外 一 个 有 趣 的 例子 。“ 查 询 不 供应 零件 PNO 的 供应 商 SNO 的 



































SNO-PNO 组 合 ”。 这 里 给 出 Tutorial D 的 定义 : 
(S{ SNO } TIMES P { PNO } ) MINUS SP { SNO , PNO } 
这 里 用 TIMES 替代 了 JOIN， 没 有 任何 逻辑 上 的 差异 。 事 实 上 ， 在 Tutorial D 























中 支持 TIMES 主要 是 心理 上 的 原因 。 








4.10.2 ”再 论 交 运算 
就 像 你 可 能 已 经 意识 到 的 那样 ， 交 运算 也 是 联接 运算 的 一 种 特殊 情况 。 特 殊 情 














况 下 ，71 JOIN 72 与 rl INTERSECT 72 在 迪 辑 上 是 等 价 的 ， 当 且 仅 当 r7 和 x2 具有 
相同 的 类 型 ,回顾 下 面 的 例子 , “查询 至 少 一 个 供应 商 与 零件 在 同一 城市 的 城市 名 ”。 



























































下 面 是 以 前 给 出 的 规范 定义 : 


Sr 


GITY, } INTERSECT P {CITY. 








用 INTERSECT 替代 了 JOIN, 没 有 任何 逻辑 上 的 差异 ,事实 上 ,在 Tutorial 





这 日 





D 中 支持 INTERSECT 主要 是 心理 上 的 原因 。 














4.10.3 ”原始 运算 符 

INTERSECT 和 TIMES 可 以 根据 JOIN 来 进行 定义 ， 换 句 话说， 到 现在 为 止 我 所 
定义 的 所 有 运算 符 并 不 都 是 原始 的 , 不 严格 地 讲 ， 如 果 一 个 运算 符 不 能 根据 其 他 的 
运算 符 定义 ， 那 么 它 就 是 原始 的 。 一 种 可 能 的 原始 运算 符 集合 就 是 {限制 、 投 影 、 
接 、 并 、 差 }。 另 一 种 可 能 就 是 用 乘积 代 蔡 联接 。 注 意 ， 这 里 没有 提 到 改名 运算 
你 可 能 感到 很 惊讶 。 事实 上 ， 改 名 运算 不 是 原始 的 运算 ， 虽然 我 还 没有 提供 足够 的 
基本 原理 来 解释 这 是 为 什么 (参见 第 5 章 关 于 EXTEND 的 讨论 )。 然 而 ， 正 如 您 所 
看 到 的 ， 在 原始 的 和 实用 的 之 间 是 有 差异 的 ， 我 可 能 更 想 要 使 用 改名 运算 符 ， 即 使 
它 不 是 原始 的 ， 而 不 想 要 INTERSECT 和 TIMES 。 


4.11 关系 比较 


关系 的 类 型 对 于 这 条 规则 是 没有 例外 的 ， 即 “=” 比 较 运 算 符 必须 适用 于 任何 
类 型 ， 也 就 是 说 ， 通 过 两 个 具有 相同 类 型 了 的 关系 ”和 772， 我 们 肯定 能 够 检测 出 
它们 是 否 相 等 。 下 面 是 Tutorial D 的 一 个 例子 ; 

9 CITY Fi {ClLTY, 过 

左边 的 被 比较 字 是 在 供应 商 关 系 上 对 CITY 的 投影 , 右边 的 被 比较 字 是 在 零件 
关系 上 对 CITY 的 投影 ， 如 果 两 个 投影 相等 ， 那 么 比较 运算 的 返回 值 为 TRUE， 琴 
则 返回 值 为 FALSE。( 按 照 给 出 的 样本 数据 ， 返 回 值 为 FALSE。) 

比较 运算 符 “z”“c”( 包 含 于 )、“c”( 真 包含 于 )、“o”( 包 含 )、“”( 真 
含 ) 显然 也 受到 支持 。 注 意 ; 在 这 些 运算 符 中 ,“c” 经 常 被 错误 地 引用 为 关系 
含 运算 符 。 下 面 给 出 另外 一 个 例子 ， 它 使 用 了 “二 ”。 
3.4 "SNO} SBP (SNO 二 
这 个 表达 式 的 含义 要 着 重 解释 一 下 ， 即 查询 没有 供应 零件 的 供应 商 (返回 值 为 
TRUE 或 FALSE)。 

题 外 话 : 这 里 有 一 个 小 小 的 技术 问题 ,回顾 一 下 ,关系 代数 中 的 运算 符 都 被 假 
设 成 了 一 个 封闭 的 系统 ， 在 此 意义 下 ,每 个 运算 符 的 结果 都 被 假设 为 一 个 关系 。 但 
是 关系 比较 运算 符 的 结果 不 是 一 个 关系 , 而 是 一 个 布尔 值 ， 因 而 后 面 的 这 些 运 算 符 
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V、 








1 事实 上 , 有 可 能 定义 一 种 关系 代数 , 它 只 有 两 个 原始 运算 符 。 在 Databases, Types, and the Relational 
Model: The Third Manifesto 一 书 中 定义 了 这 样 的 关系 代数 ， 我 们 称 它 为 A， 该 书 出 版 于 2007 年 ， 
作者 为 Addison-Wesley、Hugh Darwen 和 我 。 
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是 否 被 看 作 是 关系 代数 的 一 部 分 还 不 是 很 清楚 。 目前 为 止 , 我 们 关心 的 最 重要 的 事 
情 是 当 我 们 需要 的 时 候 ， 这 些 运算 符 是 可 以 使 用 的 。 




















注意 : 每 个 公共 的 必须 条 件 都 可 以 在 某 个 给 定 的 关系 + 和 空 关系 之 间 进 行 “=” 
比较 ， 换 名 话说 ， 这 是 检测 了 是 否 为 空 的 一 种 方法 。 它 可 以 简化 成 如 下 的 定义 : 
IS EMPTY ( 工 ) 
如 果 了 是 空 的 , 则 返回 值 为 TRUE, 否则 返回 值 为 FALSE。 在 接 下 来 的 章节 ( 特 
别 是 第 6 章 ) 中 我 要 多 处 用 到 这 个 比较 。 它 的 反 向 运算 符 也 很 有 用 : 
IS NOT EMPTY ( r ) 


这 个 表达 式 逻 辑 上 等 价 于 NOT (IS_EMPTY(n))。 


4.12 修改 运算 符 的 扩充 


本 章 前 面 曾 经 注释 过 ，INSERT、DELETE、UPDATE 都 是 修改 运算 符 ， 本 身 
是 不 属于 关系 代数 的 。 然 而 ， 可 以 依照 代数 运算 符 对 它们 加 以 解释 (事实 上 ， 它 们 
已 经 被 定义 过 了 )。 例 如 ，Tutorial D 中 的 INSERT 语句 如 下 : 

工 条 SRRTI R 这 疏 

(这 里 R 是 一 个 关系 变量 名 , rx 是 一 个 关系 表达 式 ， 其 含义 是 说 明 与 R 具有 同 
样 类 型 的 一 个 关系 +。) 上 面 这 个 语句 也 可 以 简化 为 关系 赋值 : 


R:= R UNION rx; 


比如 : 


INSERT SP RELATION { TUPLE { SNO ‘SsS5’ , PNO ‘P66’ , QTY 700 } }，; 


可 以 实现 在 供应 商 关 系 变量 SP 中 插入 一 个 只 包含 一 个 新 的 元 组 的 关系 ,或 者 不 
严格 地 但 更 直观 地 讲 ， 向 SP 中 插入 一 个 元 组 (回顾 一 下 ， 严 格 地 说 ， 在 关系 模型 中 
是 根本 不 存在 元 组 级 的 运算 符 的 )。 注 意 : 也 许 你 想 要 了 解 TUPLE FROM， 从 某 种 
意义 上 来 说 它 是 属于 元 组 级 的 (回顾 练习 4.7d4， 就 是 从 只 包含 一 个 元 组 的 关系 中 抽 
取 元 组 )， 在 扩展 数据 库 的 环境 下 ， 有 时 是 非常 需要 这 样 的 运算 符 的 ， 但 它 本 身 不 
是 关系 模型 的 一 部 分 '。 
现在 根据 并 运算 来 观察 前 面 的 INSERT 定义 , 它 暗示 了 要 插入 一 个 已 经 存在 的 
元 组 的 想法 会 执行 成 功 ( 即 使 由 R 和 rx 说 明 的 关系 是 不 可 联接 的 ， 也 能 执行 













































































































































































































































































1 如 果 你 仍然 怀疑 , 这 里 给 出 练习 4.7d 的 另 一 个 答案 , 它 没有 使 用 TUPLE FROM: ((S{SNO,STATUS} 
TIMES ((S WHERE SNO = “S2’){STATUS} RENAME {STATUS AS x})) WHERE STATUS < x){SNO}. 









































> (当然 它 不 会 插入 重复 的 元 组 ， 只 要 考虑 到 了 那些 已 经 存在 的 元 组 ， 就 

会 产生 任何 影响 。) 为 此 ，Tutorial D 又 额外 支持 一 个 称 作 D_INSERT 〈 即 不 可 
0 云 算 符 ， 语 法 如 下 : 

D INSERT R zx ; 

该 语句 可 以 速记 为 如 下 形式 : 

R := RD UNION ZX 

D_UNION 代表 不 可 连接 的 并 运算 。 不 可 联接 的 并 运算 和 规则 的 并 运算 一 行 ， 
除了 它 的 运算 数 关 系 不 需要 有 公共 元 组 以 外 (否则 会 出 现 例 外 情况 )， 它 仍然 使 用 
D_INSERT 插入 一 个 已 存在 的 元 组 的 企图 会 失败 。 

现在 转向 DELETE，Tutorial D 中 的 DELETE 语句 定义 如 下 : 

DELETE RR TR 

(这 里 R 是 一 个 关系 变量 名 , rx 是 一 个 关系 表达 式 ， 其 含义 是 说 明 与 及 
样 类 型 的 一 个 关系 r。) 上 面 这 个 语句 也 可 以 简化 为 关系 赋值 : 





































































































普 
my 
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R: := R MINUS rx 
例如 ， 下 面 的 DELETE 语句 : 
DELETE SP RELATION { TUPLE { SNO ‘S1’ , PNO ‘Pl1’ , QOTY 300 } };，; 








可 以 实现 从 供应 商 关 系 变量 SP 中 删除 只 包含 一 人 或 者 不 严格 地 
说 ， 它 从 SP 中 删除 了 一 个 元 组 。 注 意 : 这 里 给 出 的 是 DELETE 最 常用 的 形式 。 本 
书 中 前 面 的 例子 都 采用 了 “DELETE R WHERE jx” 形式 定义 。 en 
讲 用 “DELETE” 简 化 代 众 “DELETE Rrx”， 这 里 rx 反 过 来 可 以 采用 “R WHERE 
bx” 的 形式 。 
当然 ,前面 的 这 个 定义 暗示 了 删除 “一 个 不 存在 的 元 组 ”的 想法 会 成 功 的 ( 例 
如 ， 由 xx 说 明 的 一 个 关系 根本 不 存在 于 由 R 说 明 的 关系 中 ， 但 要 执行 删除 操作 也 
会 成 功 )。 为 此 ，Tutorial D 又 额外 文 持 一 个 称 作 I DELETE〈 即 被 包含 的 删除 》 
的 运算 符 ， 语 法 如 下 : 

I_ DELETE 有 

上 面 语句 可 以 速记 为 : 

R:= R I_ MINUS a 

I_MINUS 代表 被 包含 的 减法 运算 ， 表 达 式 r1 I MINUS r2 与 r1 MINUS 72 是 
等 价 的 ， 除 了 出 现在 r2 中 的 元 组 在 r7 中 这 个 条 件 以 外 。 换 句 话 说 ，r2 必须 包含 在 
rl 中耕 则 会 有 例外 情况 发 生 )。 因 此 ， 使 用 LDELETE 删除 一 个 不 存在 的 元 素 的 
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方法 将 会 失败 。 

最 后 ，Tutorial D 中 的 UPDATE 语句 肯定 与 赋值 语句 是 一 致 的 。 然 而 ， 执 行 
的 细节 要 比 INSERT 和 DELETE 复杂 得 多 ， 为 此 我 们 将 其 推迟 到 第 5 章 讲 解 ( 参 
见 练习 5.2)。 












































4.13 ”练习 [I 


4.9 ”向 本 章 前 面 给 出 的 注释 一 样 ， 闭 包 在 关系 模式 是 很 重要 的 ， 同 样 原因 ， 
在 二 进 制 的 算术 中 也 是 很 重要 的 。 然 而 ， 在 算术 中 ， 有 一 种 情况 会 破坏 闭 包 ， 即 被 
0 除 。 在 关系 代数 中 有 类 似 的 情况 吗 ? 
4.10 _ TutorialD 下 面 的 表达 式 的 含义 是 什么 ? 
(GD 开 NO 区 NO SNG 人 
b.S JOIN SP JOIN P 
c.( (SS RENAME { CITY AS SC } ) { SC } ) JOIN 
( ( P RENAME { CITY AS PC } ) { PC }) 
d.SP { SNO } I MINUS S { SNO } 
e. ( S WHERE STATUS = 20 ) { CITY } D UNION 
( P WHERE COLOR = 'Blue' ) { CITY } 
4.11 写 出 下 列 查 询 的 Tutorial D 表达 式 : 
a. 查询 伦敦 供应 商 供应 的 零件 号 。 
b. 查询 不 是 由 伦敦 供应 商 供应 的 零件 号 。 
c. 查询 供应 关系 中 具有 供应 关系 的 供应 商号 和 零件 号 。 
4.12 ”将 自己 给 出 的 一 些 查 询 描 述 成 Tutorial D 表达 式 ， 可 以 依据 自己 定义 的 
数据 库 ， 或 者 依据 供应 商 -零件 数据 库 。 





































































































































































































4.14 ”答案 [I 


4.9 没有! 但 是 我 这 里 不 能 解释 其 原因 。 因 为 目前 还 没有 足够 的 基本 原理 可 
以 来 解释 这 个 问题 。( 然 而 ， 至 少 我 可 以 说 出 一 条 原因 ， 请 参见 附录 B 中 的 两 个 特 
殊 关 系 TABLE DUM 和 TABLE _DEE。) 进一步 的 解释 可 参见 SOL and Relational 
Theory 一 书 。 

4.10 a. 返回 在 同一 城市 的 零件 号 和 供应 商号 。 注 意 ， 整 个 表达 式 中 的 两 个 
内 部 投影 从 逻辑 上 来 说 是 不 需要 的 (当然 这 也 不 是 错误 的 )。 你 认为 优化 器 会 忽略 
它们 吗 ? 我 们 希望 它 这 样 做 吗 ? 



































































































































































































































































































































































































































62 第 4 章 关系 运算 符 I 
b. 获得 由 SNO-SNAME-STATUS-CITY-PNO-QTY-PNAME-COLOR-WEIGHT 
元 组 构成 的 新 关系 ， 其 元 组 值 为 供应 商 和 零件 属于 同一 城市 的 元 组 。( 注 意 S JOIN 
SP 的 结果 只 有 2 个 属性 ， 即 PNO 和 CITY， 这 与 关系 变量 P - 样 )。 
c. SC-PC 构成 的 元 组 所 组 成 的 关系 ， 但 其 值 要 满足 供应 商 在 城市 SC， 零 
件 在 城市 PC 这 个 例子 中 的 联接 运算 其 实 是 笛 卡 儿 乘 积 )。 
d. 例外 情况 ， 除 非 这 个 城市 不 是 每 个 供应 商都 供应 零件 ， 这 时 I MINUS 就 变 
为 MINUS( 结 果 就 是 供应 商号 的 一 个 空 集 )。 
e. 例外 情况 ， 除 非 这 个 城市 不 是 状态 值 为 20 且 提 供 蓝 色 零 件 的 供应 商 所 在 的 
城市 ， 这 时 D_UNION 就 变 为 UNION。 
4.1] a. ( SP JOIN ( S WHERE CITY = 'London' ) ) { PNO } 
b. P { PNO } MINUS ( SP JOIN ( SWHERE CITY = 'London' ) ) { PNO } 
c. WITH ( t := SP { ALL BUT QTY } ) 
( ( t RENAME { PNO AS PX } ) JOIN ( RENAME { PNO AS PY } ) ) 
{ PX , PY } 
注意 : 这 个 例子 可 以 采用 我 们 常用 的 样本 数据 ， 假 设 供 应 商 S1 供应 零件 P1 
和 P2， 结 果 中 就 会 存在 一 对 “Pl1，P2)。 但 是 同样 也 会 存在 〈(P2,，P1)、(Pl1, P1) 
等 。 我 们 要 消除 这 种 见 余 ， 因 此 可 以 限制 结果 对 要 满足 PX<PY。 
4.12 上 略 
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男人 的 判断 …… 因 此 附 上 
小 空间 里 的 无 限 财富 。 
一 一 Christopher Marlowe: The Jew of Malta (1592) 





像 第 4 章 给 出 的 注释 一 样 ， 为 了 满足 这 个 简单 的 定义 “一 个 或 多 个 关系 ， 除 了 一 
个 关系 以 外 ” 就 要 定义 任意 数量 的 运算 符 。 前 面 的 章节 中 描述 了 Codd 的 原始 运算 
符 〈 联 接 、 投 影 等 )。 在 这 一 章 中 ， 我 将 要 描述 许多 附加 的 运算 符 ， 这 些 运 算 符 在 发 
明 关 系 模型 后 就 已 经 定义 了 。 特 别 要 讨论 的 有 : (a) MATCHING 和 NOT MATCHING; 
(b) EXTEND; (c) 映像 关系 ; (d) 聚合 、 分 类 汇总 ， 以 及 其 他 相关 的 。 
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5.1 匹配 和 非 匹 配 


实际 上 已 经 证 实 , 大 多 数 的 关系 表达 式 〈 不 是 所 有 的 ) 似乎 都 需要 联接 运算 符 ， 
因为 它们 的 规范 操作 要 求 需要 一 个 相关 的 、 但 逻辑 上 有 区 别 的 运算 符 ， 称 为 半 联 接 
(semijoin， 在 Tutorial D 中 称 为 MATCHING， 即 匹配 )。 下 面 给 出 一 个 例子 ， 查 
询 1:“ 查 询 至 少 供应 了 一 个 零件 的 供应 商 的 详细 信息 ” 表达 式 如 下 : 

S MATCHING S 


查询 1 的 运行 结果 如 表 5-1 所 示 。 



















































































表 5-1 查询 1 的 运行 结果 
SNO SNAME STATUS CITY 
Sl Smith 20 London 
S2 Jones 10 Paris 
S3 Blake 30 Paris 


S4 Clark 20 London 





























其 结果 中 包含 了 至 少 与 一 个 供应 关系 匹配 的 供应 商 的 元 组 。 

下 面 给 出 半 联 接 的 定义 〈 注 意 ， 它 似乎 在 可 联接 性 的 定义 中 出 现 过 ， 即 在 第 4 
章 定义 的 )。 

定义 ; 关系 六 和 /72 是 可 联接 的 ，rl 具有 属性 47, 42,… , 47 (只 具有 这 些 属性 )， 
那么 表达 式 r1 MATCHING 72 代表 了 rl 和 2 的 半 联 接 运算 (注意 运算 次 序 )。 它 
返回 一 个 关系 ， 该 关系 等 价 于 7 和 x2 的 联接 运算 在 {41, 42, …, 4n} 的 投影 。 

换 名 话说 , 表达 式 r1 MATCHING 72 返回 的 关系 等 价 于 表达 式 r1 JOIN 72 返回 
的 关系 ， 但 要 在 关系 xr] 的 属性 上 做 投影 。 因 此 ， 表 达 式 S MATCHING SP 可 以 速 
写 为 如 下 的 表达 式 : 

(CS JOLIN"SP. ) tt “SNO., .x “SNAME.; ‘STATUS yy CITY 1} 

注意 : 通常 情况 下 ，r7 MATCHING xr2 与 r2 MATCHING r7 是 不 等 价 的 。 
在 相似 情况 下 ,大 多 数 的 关系 运算 符 似 乎 都 需要 差 运 算 符 ， 因 为 它们 正规 的 格 
式 要 求 一 个 相关 的 、 但 逻辑 上 有 区 别 的 运算 符 , 称 为 半 差 (semidifference，Tutorial 
D 中 称 为 NOT MATCHING， 即 不 匹配 )。 下 面 给 出 一 个 例子 ， 查 询 2:“ 查询 没有 
供应 零件 的 所 有 供应 商 的 详细 信息 ” 表达 式 如 下 : 


S NOT MATCHING SP 


查询 2 的 运行 结果 如 表 5-2 所 示 。 
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表 5-2 查询 2 的 运行 结果 
SNO SNAME STATUS CITY 
S5 Adams 30 Athens 

















这 个 结果 包含 了 与 供应 关系 中 所 有 元 组 都 不 匹配 的 元 组 。 

下 面 给 出 半 差 的 定义 。 

定义 : 关系 rl 和 rr2 是 可 联接 的 ， 那 么 表达 式 r17 NOT MATCHING 72 代表 了 
rl 和 2 的 半 差 运算 (注意 运算 次 序 )。 它 返回 一 个 关系 ， 该 关系 等 价 于 r1 MINUS 
(r1 MATCHING x2) 返 回 的 关系 。 
举例 如 下 ， 表 达 式 SNOT MATCHING SP 可 以 速记 为 如 下 的 表达 式 : 

S MINUS ( S MATCHING SP ) 

顺便 说 一 下 ， 如 果 xl 和 2 是 不 能 联接 的 , 但 具有 同一 种 类 型 ,' NOT MATCHING 
会 发 生 什 么 情况 吗 ? 给 出 一 个 例子 ， 考 虑 下 面 的 表达 式 ; 

S {CITY} NOT MATCHING P {CITY} 


根据 定义 ， 该 表达 式 可 以 速写 为 如 下 形式 : 
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S {CITY} MINUS (S {CITY} MATCHING P { CITY } ) 
我 确信 ， 你 也 发 现 了 ， 后 面 的 这 个 表达 式 还 可 以 简写 成 如 下 形式 : 


S {CITY} MINUS P {CITY} 
换 句 i 


话说 ， 规 则 的 差 运 算 符 
MATCHTING 的 一 种 特殊 情况 。 
更 基础 、 重 要 。 然 而 ， 注 
守 中 的 任何 















































因此 ,在 
FE 意 这 种 相似 的 表示 不 和 





























个 都 不 是 男 


考虑 下 面 的 查询 ， 





“对 于 每 个 零件 ， 





( 即 Tutorial D 中 的 MINUS) 实际 上 是 NOT 
E 某 种 意义 上 , NOT MATCHING 比 MINUS 
应 用 在 MATCHING 和 JOIN 上 。 





个 的 特殊 情况 。 





公立 





查询 4 








部 零件 的 信息 ， 


包括 以 克 为 单位 表 














重量 ” 


示 的 零件 
刻 我 有 个 想法 ， 
果 只 有 图 



































1.1 中 给 出 的 








前 的 一 个 查询 的 例子 ， 查 询 3 他 

















因此 这 就 是 我 们 需要 EXTEND ( 即 扩 展 ) 的 原 











日 
果 只 





有 第 4 章 介 
那些 关系 )， 那 么 我 们 就 没有 办 法 来 规范 地 表示 这 个 查 


。( 回 顾 一 下 ， 在 关系 变量 P 了 中 零件 重量 是 以 磅 为 单位 表示 的 。) 此 
可 以 让 你 足以 相信 ， 如 














如 的 那些 运算 符 《〈 当 然 ， 如 
询 。 
































因 。 
F 意 ，1 磅 =454 列 : 





下 面 是 使 用 这 个 运算 符 实现 以 















































EXTEND P : { GMWT := WEIGHT * 454 } 
查询 3 的 运行 结果 如 表 5-3 所 示 。 
表 5-3 查询 3 的 运行 结果 
PNO PNAME COLOR WEIGHT CITY GMWT 
Pl Nut Red 12.0 London 54480 
P2 Bolt Green 17.0 Paris 7718.0 
P3 Screw Blue 17.0 Oslo 7718.0 
P4 Screw Red 14.0 London 6356.0 
PS Cam Blue 12.0 Paris 5448.0 
P6 Cog Red 19.0 London 8626.0 
强调 : 关系 变量 P 在 数据 库 中 是 没有 改变 的 ! 表达 式 EXTEND P: { GMWT := 
WEIGHT * 454 } 仅仅 是 一 个 表达 式 ， 像 任何 表达 式 一 样 ， 它 只 是 表示 一 个 值 。 而 


且 ， 





为 它 


是 一 个 表达 式 ， 不 是 语句 ， 所 以 也 可 以 嵌 套 在 其 他 的 表达 式 中 。 





事实 
第 一 个 版 本 的 定义 。 

定义 : 关系 7 不 具有 属性 4， 那 
系 的 标题 是 在 ” 的 标题 中 扩展 了 























上 ，EXTEND 有 两 种 形式 或 版 本 。 我 们 一 会 儿 介绍 第 





么 表达 式 rT; 
届 性 4， 其 内 容 为 所 有 元 组 t 的 集合 ， 






































二 个 版 本 ， 这 里 先 














{4 := exp} 返 回 一 个 关系 ， 该 关 


每 个 元 组 t 
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都 扩展 了 属性 4 的 值 ，4 值 由 作用 于 > 的 表达 式 exp 求 得 。 

现在 ， 我 可 以 说 EXTEND 表达 式 可 以 嵌 套 在 其 他 的 表达 式 中 。 下 面 举 例 说 明 ， 
查询 4:“ 和 查询 零件 重量 大 于 7000 克 的 零件 号 及 其 重量 〈 以 克 为 单位 )”。 表 达 式 如 下 : 
( ( EXTEND P : { GMWT := WEIGHT * 454 } ) 


WHERE GMWT > 7000.0 ) 
{ PNO , GMWT } 


正如 你 所 看 到 的 , 这 也 是 投影 和 约束 运算 的 扩展 。 查询 4 的 运行 结果 如 表 5-4 所 示 。 

























































































表 5-4 查询 4 的 运行 结果 
PNO WEIGHT 
P2 7718.0 
P3 7718.0 
Pp6 8626.0 











实际 上 ，EXTEND 真 的 是 一 个 很 重要 的 运算 符 。 为 此 ， 我 要 多 举 几 个 例子 ， 
并 给 出 相应 的 结果 。 























1. 查询 5: EXTEND S : { TAG := 'Supplier' } 
查询 5 的 运行 结果 如 表 5-5 所 示 。 




















表 5-5 查询 $ 的 运行 结果 
SNO SNAME STATUS CITY TAG 
Sl Smith 20 London Supplier 
S2 Jones 10 Paris Supplier 
S3 Blake 30 Paris Supplier 
S4 Clark 20 London Supplier 
S5 Adams 30 Athens Supplier 





























2. 查询 6: EXTEND ( P JOIN SP ) : { SHIPWT := WEIGHT * QTY } 
查询 6 的 运行 结果 如 表 5-6 所 示 。 














表 5-6 查询 6 的 运行 结果 
PNO OO WEIGHT SNO QTY SHIPWT 
Pl 120 S1 300 3600.0 














3. 查询 7: EXTEND S : { SCITY := CITY } ) { ALL BUT CITY } 
查询 7 的 运行 结果 如 表 5-7 所 示 。 
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表 S-7 查询 7 的 运行 结果 
SNO SNAME STATUS SCITY 
Sl Smith 20 London 
S2 Jones 10 Paris 
S3 Blake 30 Paris 
S4 Clark 20 London 
S5 Adams 30 Athens 














注意 : 最 后 的 一 个 例子 〈 即 例子 3) 说 明 一 点 , 就 像 第 4 章 提 到 的 一 样 , RENAME 
不 是 原始 的 运算 符 ， 因 为 给 出 的 表达 式 ( 投 影 的 扩展 ) 与 下 面 的 改名 表达 式 逻 辑 上 
是 等 价 的 。 


S RENAME { CITY AS SCITY } 


现在 转向 EXTEND 的 第 二 种 形式 ， 这 种 形式 的 主要 目的 是 完成 “要 是 … 又 怎 
么 样 ? ”的 查询 。 换 句 话 说 ， 它 用 来 观察 特定 变化 对 数据 库 产生 的 影响 ,但 实际 上 
没有 产生 任何 变化 。 下 面 给 出 一 个 例子 (如 果 零 件 重 量 以 克 为 单位 来 代 蔡 以 人 磅 为 单 
位 ， 会 发 生 什么 ?): 

EXTEND P : { WEIGHT := WEIGHT * 454 } 

这 个 例子 还 是 很 简单 的 ， 因 为 圆 括号 属性 赋值 中 的 目标 属性 不 是 一 个 新 的 属 
性 ， 而 且 这 个 例子 在 EXTEND 以 前 的 例子 中 也 看 过 ， 它 也 是 特定 关系 中 已 存在 的 
属性 〈 在 当前 这 个 例子 中 ， 该 关系 就 是 关系 变量 P 的 当前 值 )。 整 个 表达 式 完 全 等 
价 于 下 面 这 个 式 子 : 

( ( EXTEND P : { GMWT := WEIGHT * 454 } ) { ALL BUT WEIGHT } ) 

RENAME { GMNT AS WEIGHT } 







































































































































































下 面 给 出 EXTEND 第 二 种 形式 的 定义 。 

定义 : 关系 "具有 属性 4， 那么 表达 式 EXTEND7 : {4 := exp} 返 回 一 个 关系 ， 
该 关系 的 标题 与 + 的 标题 相同 ， 内 容 是 所 有 元 组 t 的 集合 ， 元 组 t 的 值 来 源 于 元 组 
r， 但 元 组 r 中 属性 4 的 值 要 用 表达 式 exp 的 值 替 代 。 


5.3 映像 关系 

不 严格 地 说 ， 映 像 关 系 (image relation) 具有 某 些 元 组 的 某 个 关系 的 “映像 ” 
(通常 情况 下 ， 也 可 能 是 其 他 关系 中 的 元 组 ， 但 不 是 必须 的 )。 例 如 ， 还 是 参照 供应 
商 - 关 系数 据 库 ， 下 面 的 例子 就 是 供应 关系 的 一 个 映像 〈 其 取 值 来 自 于 关系 变量 SP 












































































































































的 当前 值 )， 是 对 供应 商 S4 的 取 值 形成 的 一 个 映像 ， 如 表 5-8 所 示 。 



































表 5-8 供应 商 S4 在 供应 关系 SP 中 的 映像 
PNO QTY 
P2 200 
P4 300 


PS 400 





显然 ， 这 个 特殊 的 映像 关系 可 以 通过 下 面 Tutorial D 的 表达 式 获 得 : 


( SP WHERE SNO = 'S4' ) { ALL BUT SNO } 


但 通常 情况 下 ， 了 映像 是 一 个 非常 有 用 的 、 而 且 应 用 很 广 的 一 个 概念 ， 因 此 我 们 
希望 能 够 有 一 种 简化 的 方式 来 定义 它 。 上 面 这 个 例子 的 速记 方式 如 下 : 


3 WHERE ( lSP ) { PNO } = P { PNO } 


在 这 个 表达 式 中 , 子 表达 式 lISP 是 一 个 映像 关系 的 引用 , 它 表示 与 S$ 的 当前 

组 值 一 致 的 一 个 映像 关系 。 解 释 如 下 。 

口 ” 首 先 ， 整个 表达 式 要 求 一 个 关系 的 特定 子 集 , 该 关系 的 值 为 关系 变量 S 的 

当前 值 〈 例 如 ， 供 应 商 关 系 的 一 个 子 集 )。 

口 ”问题 中 的 子 集 由 所 有 供应 商 关 系 的 元 组 组 成 , 但 它 的 值 由 WHERE 子 句 中 
的 布尔 表达 式 判断 为 TRUE 的 值 组 成 。 这 个 布尔 表达 式 不 是 一 个 简单 的 约 
束 表 达 式 ， 它 涉及 对 属性 的 引用 ， 但 引用 的 属性 不 是 关系 变量 $ 的 属性 ， 
它 也 涉及 关系 变量 的 引用 。 事 实 上 ， 正 如 你 看 到 的 ， 它 是 一 个 关系 型 的 等 
值 比较 。 

口 ” 等 值 比较 中 右边 的 运算 数 是 关系 变量 P 当前 值 在 PNO 上 的 投影 ， 因 而 包 
含 了 6 个 零件 号 ， 即 P1，P2，…，P6 (或 者 是 包含 6 个 零件 号 的 元 组 )。 
左边 的 运算 数 也 是 某 个 关系 在 PNO 上 的 投影 ， 因 此 运算 数 关 系 必须 要 具 

有 相同 的 类 型 。 

口 ” ”我们 可 以 想象 一 下 ， 这 个 等 值 比较 可 以 按照 任意 的 顺序 ， 对 供应 商 关 系 中 
的 每 个 元 组 依次 执行 一 个 元 组 的 等 值 比较 。 考 虑 这 样 的 一 个 元 组 ， 即 供应 
商 关 系 的 一 个 元 组 Sx (我 们 可 以 称 之 为 元 组 四 。 对 于 元 组 t， 表 达 式 !1 SP 
的 含义 是 关系 变量 SP 的 一 个 当前 值 关 系 的 相应 的 映像 关系 。 换 名 话说 ， 

ee ee 

。 人 例如， 如果 Sx 值 为 S4， 它 就 表示 了 本 部 分 开头 给 出 的 那个 关系 。 

于 元 组 t， 表 达 式 (SP){PNO} 《例如 ， 在 映像 关系 中 对 PNO 的 投影 ) 

表示 了 由 供应 商 Sx 供应 零件 的 编号 的 集合 。 
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口 “ 因 而 ， 这 个 表达 式 的 含义 就 是 供应 关系 $ 中 的 供应 商 的 集合 ， 这 些 供应 商 
提供 的 零件 集合 要 等 价 于 关系 变量 P 在 PNO 上 投影 形成 的 所 有 零件 编号 
的 集合 。 整 个 表达 式 的 含义 就 是 完成 查询 8:“ 和 查询 供应 了 所 有 零件 的 供 
应 商 ” 其 运行 结果 如 表 5-9 所 示 。 

表 5-9 查询 8 的 运行 结果 
SNO SNAME STATUS CITY 
Sl Smith 20 London 

进行 讲解 之 前 ， 我 要 强调 一 点 ,“ 查 询 供 应 了 所 有 零件 的 供应 商 ” 并 不 是 一 个 

简单 的 查询 。 在 SQL 中 ， 要 编写 好 儿 行 的 相当 复杂 的 代码 来 实现 此 查询 ， 我 们 将 











/mw 


4 





在 本 书 的 第 三 部 分 看 到 这 些 内 容 。 为 了 把 它 规 范 化 成 “ 可 以 通过 构建 一 个 







































































































































































































































































映像 关系 来 实现 ， 因 而 映像 关系 是 非常 实用 的 。 

顺便 再 举 一 个 例子 ， 回 顾 第 4 章 中 练习 4.7 的 e， 实 现 “ 查 询 由 巴黎 供应 商 供 
应 的 所 有 零件 号 码 ”。 在 第 4 章 中 给 出 的 练习 答案 如 下 : 

( P WHERE 

( ( SP RENAME { PNO AS x } ) 
WHERE x = PNO ) { SNO } = 
( ( S WHERE CITY = 'Paris' ) { SNO } ) ) { PNO } 

但 是 它 也 可 以 用 映像 关系 实现 : 

( PWHERE ( !SP ) { SNO }2 ( S WHERE CITY = 'Paris' ) { SNO } ) { PNO } 

下 面 给 出 另 一 个 例子 ， 假 设 给 出 一 个 供应 商 - 关 系数 据 库 的 修订 版 本 《与 
我 们 通常 使 用 的 例子 相 比 ， 它 同时 被 扩充 也 被 简化 了 )， 形 式 如 下 (只 是 简要 
给 出 ): 

S { SNO } /* 供应 商 */ 

SP { SNO ，PNO } /* 供应 商 及 供应 的 零件 */ 

PJ { PNO ，JNO } /* 被 某 个 工程 使 用 的 零件 */ 

J { JNO } /* 工程 号 */ 

关系 变量 J 代表 工程 (projects，JNO 代表 工程 号 )， 关 系 变量 PJ 代表 了 工 
程 与 零件 之 间 的 关系 。 现在 考虑 查询 ,“ 查 询 所 有 的 供应 商 -工程 号 对 (sno-jno)， 
但 要 满足 sno 是 关系 变量 $ 中 的 值 ，jno 是 关系 变量 J 中 的 值 ， 并 且 工 程 jno 使 
用 了 sno 供应 的 所 有 零件 ”。 这 是 一 个 相当 复杂 的 查询 ， 但 是 用 映像 关系 表示 就 
很 简单 了 : 

( S TIMES J ) WHERE 1PJ S 1SP 




















下 一 部 分 我 们 会 进一步 看 到 涉及 映像 关系 的 例子 , 但 是 现在 我 们 用 一 个 定义 来 



































结束 这 一 部 分 (给 出 这 个 定义 的 目的 主要 是 记录 ， 如 果 第 一 次 阅读 时 感觉 理解 上 有 
点 困难 ， 请 不 要 担心 )。 

定义 : 关系 rl 和 x2 是 可 联接 的 ， 它 们 的 公共 属性 被 称 作 47, 42,…, 4n。 是 
7 的 元 组 ， 妇 是 r2 的 元 组 ， 它 们 在 属性 47, 42, …, 42 上 具有 相同 的 值 ， 关 系 r3 
是 72 的 约束 , 它 的 元 组 中 不 包含 刀 , 关 系 r4 是 r3 的 投影 ,但 要 除去 属性 47, 42，…， 
An， 那 么 r4 就 是 与 1 一 臻 的 映像 关系 。 
























































5.4 聚集 和 分 类 汇总 


关系 模型 中 的 聚集 运算 符 (aggregate operator) 通常 不 是 关系 运算 符 ， 因 为 
它 的 结果 不 是 一 个 关系 。 相 反 ， 聚 集运 算 符 只 产生 一 个 单独 的 值 ， 是 某 些 关 系 
中 一 些 属性 值 的 聚集 (聚集 可 以 是 一 个 集合 或 者 包 “， 否 则 ， 在 使 用 COUNT 运 
算 符 的 情况 下 ， 还 是 有 点 特殊 ， 它 的 值 来 自 于 对 整个 关系 的 聚集 。 下 面 是 几 个 
例子 : 

























































































Xs COUNT CS 3 /* X= 5 */ 
Y := COUNT ( S { STATUS } ) ; /* Y= 3 */ 
Zz := SUM (SP { QTY } ) ; /* 2 = 1000 */ 











就 像 注释 中 指出 的 那样 ， 第 一 个 赋值 语句 把 值 5 赋 给 了 变量 X〈 即 供应 商 
关系 的 度 )， 第 二 个 赋值 语句 把 值 3 赋 给 了 变量 Y( 供 应 商 关 系 在 STATUS 上 进 
行 投影 后 的 度 ), 第 三 个 赋值 语句 把 值 1000 赋 给 了 变量 Z( 即 供应 关系 在 QTY 
上 投影 后 求 得 的 总 和 。) 通常 情况 下 ，Tutorial D 的 聚集 运算 符 采用 如 下 形式 
调用 : 

a99 ( rel exp [, exp ] ) 

可 用 的 运算 符 包括 : COUNT、SUM、AVG、MAX、MIN、AND、OR、XOR 
(最 后 三 个 应 用 在 布尔 值 的 聚集 中 )。 在 exp 中 ， 对 于 属性 的 引用 可 以 出 现在 任何 
允许 使 用 标识 符 的 地 方 ， 中 括号 的 意思 是 表达 式 exp 是 可 选 的 ; 在 COUNT 中 则 
必须 要 省 略 它 ， 只 要 关系 表达 式 rel exp 表示 的 关系 的 度 为 1， 那么 就 省 略 。 在 这 
种 情况 下 ， 假 设 了 表达 式 是 由 关系 中 只 包含 一 个 属性 的 引用 组 成 。 下 面 给 出 一 些 

1 SUM (0 SP ; QTY ') 

这 个 表达 式 的 含义 是 对 关系 变量 SP 中 的 所 有 重量 求 和 (也 可 以 说 是 对 SP 
E 量 的 所 有 当前 值 求 和 )， 其 结果 为 3100。 
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1 包 也 称 为 复合 集合 ， 即 集合 中 允许 有 重复 的 元 素 。 


2.SUM ( SP { QTY } 





这 个 表达 式 是 SUM(SP{QTY},QTY) 的 一 利 
的 重量 的 和 ， 其 结果 为 1000《〈 可 以 与 前 
3.AVG ( SP ，3 * QTY 
这 个 表达 式 实现 的 是 对 SP 中 每 个 化 





| 








案 是 775)。 





聚集 运算 的 基本 思想 就 是 这 样 。 它 们 主要 
口 “ 它 们 可 以 用 在 分 类 汇总 (summarization) 运算 中 。 





5.4 聚集 和 分 类 汇总 71 

















应 关系 的 





















































两 种 情况 。 
5.4.1 分 类 江 总 


考虑 下 面 的 查询 ， 查 询 9: 
量 ”。 下 面 给 出 Tutorial D 的 规范 语句 : 





出 




















| 由 
a 
4 





速写 形式 ,表示 了 SP 中 所 有 不 重复 
面 的 例子 对 上 












































个 元 组 进行 聚集 运算 就 相当 于 在 某 个 关系 上 也 
口 ” 它们 也 可 以 用 在 WHERE 子 句 中 ， 因 
restriction) 的 引用 《相当 草率 地 讲 ， 纯 粹 是 为 了 当前 的 目的 )。 

值得 提 及 的 一 点 是 ， 偶 尔 两 种 情况 可 能 都 会 出 现 ， 影 像 关 系 也 几乎 都 会 涉及 这 





j 在 以 下 两 个 方面 : 








都 翻 3 倍 后 求 其 平均 值 ( 答 





























有 点 不 严格 地 讲 ， 对 每 


上 县/ 
京 / 。 

















此 文 持 对 广义 约束 〈generalized 








“对 每 个 供应 商 ， 查 询 供 























应 商号 及 其 供应 的 零件 数 





EXTEND 全 '{ SNO } % { ‘PCT : llSP ) 
查询 9 的 运行 结果 如 表 5-10 所 示 (尤其 注意 供应 商 S5 的 元 组 )。 
表 5-10 结果 

SNO PCT 

Sl 6 

S2 乡 

S3 1 

S4 3 

S5 0 


观察 一 ee 














结果 真正 构成 了 一 个 分 类 汇 











总 (检查 早期 给 出 的 不 














严格 的 定义 ): 聚集 构成 《实际 上 是 分 类 统计 )， 该 聚集 作用 于 供应 关系 的 每 个 

















元 组 上 ， 而 每 个 元 组 是 在 供应 商 关系 上 允 SNO 投影 后 形成 的 。 
顺便 再 举 一 个 例子 ， 考 虑 查询 10: 









































4 于 每 个 供 


应 两 件 的 总 重量 ”。Tutorial D 的 规范 定义 如 下 : 











EXTEND S { SNO } : { TOTO : (SP ， 


查询 10 的 运行 结果 如 表 5-11 所 示 (尤其 注意 供应 商 S5 的 元 组 )。 





应 商 ， 查 询 它 的 供应 商号 及 供 

















QTY 




















表 S-11 查询 10 的 运行 结果 
SNO TOTQ 
S1 1300 
S2 700 
S3 200 
S4 900 
S5 0 














下 面 看 第 3 个 ， 也 是 最 后 一 个 例子 ， 考 虑 查询 11:“ 对 于 每 个 供应 商 ， 查 1 
所 有 供应 商 的 详细 信息 ， 以 及 相应 的 供应 零件 的 总 重量 、 最 大 重量 和 最 小 重 上 
这 里 给 出 Tutorial D 的 宛 长 定义 但 是 它 需 要 进行 一 些 修正 ， 一 会 儿 我 将 解释 
这 人 
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也 山 















































EXTEND ( S WHERE CITY = ‘Athens' ) : { TOTO := SUM ( !SP , QTY ) ， 
MAXO := MAX ( !SP , QTY ) ， 
MINQ := MIN ( !SP , QTY ) } 








这 个 例子 说 明了 多 重 EXTEND 的 用 法 。 注 意 : 我 顺便 提 一 下 ， 很 多 其 他 
Tutorial D 运算 符 也 存在 多 重 运算 的 形式 ， 尤 其 包括 RENAME 和 UPDATE， 其 人 
的 运算 符 不 在 本 书 的 讨论 范围 之 内 。 

这 个 例子 引出 了 一 个 更 重要 的 问题 ， 即 如 果 聚 集运 算 符 〈 即 agg) 的 运算 结果 
是 空 集 ， 那 么 会 发 生 什么 ”我们 已 经 看 到 ， 如 果 agg 是 COUNT 或 SUM， 运 算 结 
果 是 0。 至 于 其 他 的 运算 符 ， 如 果 agg 是 AND， 则 结果 为 TRUE; 如 果 agg 是 OR 
或 XOR， 则 结果 为 FALSE; 如 果 agg 是 AVG、MAX 或 MIN， 则 会 例外 ， 在 AVG 
情况 下 ， 因 为 如 果 结 果 是 空 集 ， 就 意味 着 对 空 集 求 平 均值 ， 会 出 现 被 零 除 的 情况 ， 
在 MAX 和 MIN 的 情况 下 ， 因 为 运算 符 的 结果 显然 是 输入 的 一 部 分 ， 如 果 输 入 是 
空 集 就 意味 着 没有 值 存 在 。 注 意 : COUNT 和 SUM 返回 值 为 0、AND 返回 值 为 
TRUE、OR 或 XOR 返回 值 为 FLASE 的 原因 是 ， 每 一 种 情况 下 指示 的 结果 都 有 相 
应 认定 的 值 。 参 考 SOL and Relational Theory 可 以 获得 进一步 的 解释 。 

那么 ， 如果 AVG、MAX 和 MIN 在 有 可 能 作用 于 空 集 的 情况 下 ， 我 们 应 该 如 何 
处 理 呢 ? 下 面 就 是 前 面 那个 例子 的 修订 版 本 ， 它 说 明了 可 以 使 用 它们 的 一 些 诀 容 。 
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查询 11: EXTEND ( S WHERE CITY = "Athens' ) 
{ TOTO := SUM ( !ISP , QTY ) ， 
MAXO := 
CASE WHEN IS EMPTY ( 1SP ) THEN 0 ELSE MAX ( !SP , QTY ) END CASE ， 
MINO := 
CASE WHEN IS EMPTY ( JSP ) THEN 0 ELSE MIN ( !ISP , QTY ) END CASE } 
查询 11 的 运行 结果 如 表 5-12 所 示 。 








表 S-12 查询 11 的 运行 结果 
SNO SNAME STATUS CITY TOTQ MAXQ MINQ 
S5 Adams 30 Athens 0 0 0 














如 果 有 人 发 现 了 比 前 面 这 个 例子 更 简洁 的 答案 ， 都 可 以 公开 讨论 一 下 

对 MAX 和 MIN 的 说 明 : 事实 上 ,曾经 有 过 争论 说 如 果 MAX 和 MIN 作用 于 空 集 ， 这 
个 定义 是 根本 不 存在 的 。 为 了 确定 这 一 点 , 我们 特别 研究 一 下 MAX (下 面 的 讨论 同样 完全 
适用 于 MIN )。 首 先 ， 我 们 定义 一 个 有 双重 价值 的 运算 符 LARGER， 它 会 返回 两 个 讨论 值 
中 较 大 的 一 个 ， 那 么 ，(a) MAX 调用 基本 上 可 以 替换 为 LARGER 调用 ; (b) LARGER 也 
有 一 个 等 同 的 形式 ， 即 “ 负 无 穷 大 ”( 含义 就 是 相应 类 型 的 最 小 值 ) 所 以 ， 我 们 可 以 有 理 
由 定义 ， 即 作用 于 空 集 上 的 MAX 也 有 一 个 等 同 的 值 。 实 际 上 ， 也 许 最 好 的 办 法 就 是 同时 





提供 两 个 版 本 的 MAX ( 别 玩 了 ， 它 们 是 不 
可 以 提供 第 


值 为 x。 


5.4.2 





然而 ， 当 前 


同 的 运算 符 )， 


二 入 人 


但 进一步 的 讨论 已 经 超出 了 本 书 的 范围 。 




















也 支持 明 丰 











明确 的 分 类 汇总 





正如 你 看 到 的 , 分 类 汇总 可 以 采 
的 SUMMARIZE 运算 符 。 























下 面 给 
















































































































































































然后 让 用 户 自 己 决定 。 我 们 甚至 
三 个 版 本 ， 即 可 以 采用 附加 的 变量 xX， 这 里 x 表示 如 果 聚 集 作用 于 空 集 ， 则 返回 





] Tutorial D 中 EXTEND 和 映像 关系 来 表示 。 
出 几 个 本 部 分 前 面 讨论 的 











































































































几 个 分 类 汇总 的 例子 ， 我 们 用 SUMMARIZE 来 实现 。 第 一 个 查询 是 “对 于 每 个 供 
应 商 ， 查 询 供应 商号 及 它 所 供应 的 零件 数量 ”， 表达 式 为 : 
SUMMARIZE SP PER ( S { SNO } : { PCT := COUNT ( ) } 
第 二 个 查询 是 “对 于 每 个 供应 商 ， 查 询 供应 商 及 其 供应 的 零件 总 重量 ”表达 
式 为 : 
SUMMARIZE SP PER ( S { SNO } : { TOTO := SUM ( QTY ) } 
Ce ea 查询 供应 商 的 详细 信息 和 供应 零件 的 
总 重量 、 最 大 重量 和 最 小 重量 凡 
SUMMARIZE SP PER ( ( S WHERE CITY = 'Athens' ) { SNO } ) : 
{ TOTO := SUM ( QTY ) ， 
AXQ := MAX ( QTY ) ， 
INQ := MIN ( QTY ) } 

而 ， 按 照 我 的 意见 ，SUMMARIZE 可 以 从 语言 中 删 掉 。 一 个 理由 是 ， 
SUMMARIZE 的 表示 方式 比 EXTEND 要 笨拙 、 更 难 理解 ， 另 一 个 理由 是 它 使 所 用 
于 空 集 的 问题 更 加 复杂 化 了 我 敢 肯定 你 已 经 注意 到 了 ,但 是 我 不 想 给 出 第 3 个 例 
子 中 作用 于 空 集 的 特殊 情况 )。 还 有 更 可 怕 的 一 点 是 ， 它 们 要 依赖 一 个 已 经 收 到 怀 
































疑 的 语言 结构 , 即 summary (比如 例子 中 的 COUNT () SUM (QTY) 和 MAX (QTY ) )。 
注意 : 我 把 这 个 结构 称 作 “ 受 怀疑 的 ” 是 因为 已 经 证 实 它 很 难 跟 得 上 相应 的 语法 



































9 
的 准确 定义 〈 一 种 批判 的 声音 就 是 它 不 能 应 用 于 映像 关系 引用 中 )。 在 本 书 中 不 对 
此 做 详细 讨论 。 我 只 是 强调 一 下 ， 分 类 汇总 是 与 聚集 运算 符 调 用 是 不 一 样 的 。 例 如 ， 
下 面 的 这 个 例子 肯定 是 非法 的 : 

Z := SUM ( QTY ) ; /* 获知 / 瀑 法 1/ */ 

正 是 因为 以 上 的 这 些 考虑 ， 在 本 书 中 对 SUMMARIZE 运算 符 本 身 不 做 过 多 的 
讨论 。 


5.4.3 ”广义 约束 

像 前 面 我 提 到 的 那样 ， 广 义 约束 (Generalized Restriction ) 肯定 不 是 一 个 “ 官 
方 的 ”术语 〈 在 某 些 情况 下 ， 它 甚至 不 是 一 个 很 好 的 术语 )， 但 是 我 发 现 ， 在 该 间 
分 用 它 在 我 想 讨 论 的 地 方 做 个 标签 还 是 很 方便 的 , 例如 ， 形 如 xr WHERE bx 的 表达 
式 ， 布 尔 表达 式 bx 就 涉及 了 聚集 运算 符 的 调用 ， 甚 至 涉及 映像 关系 的 引用 。 下 面 
给 出 一 个 例子 ， 即 “查询 供应 关系 小 于 3 的 供应 商 ”: 

S WHERE COUNT ( !SP ) < 3 

其 结果 包含 了 供应 商 S2、S3、S5 的 元 组 。 
再 给 出 另外 一 个 例子 ， 即 “查询 供应 零件 重量 小 于 1000 的 供应 商 ”: 

S WHERE SUM ( !SP , QTY ) < 1000 

这 样 的 例子 还 有 很 多 ， 例 如 ,“ 查 询 供应 数量 大 于 250 的 所 有 供应 商号 及 划 
应 关系 ”: 


( EXTEND S { SNO } : { TOTQO := SUM ( !lSP , QTY ) } ) WHERE TOTQ > 250 
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再 比如 : 修改 所 有 供应 零件 重量 小 于 1000 的 供应 商 状 态 值 ， 把 它们 的 状态 值 
减 半 。 
UPDATE S WHERE SUM ( !SP , QTY ) < 1000 : { STATUS := 0.5 * STATUS } 





5.5 练习 


5.1 在 第 3 章 中 ， 在 关系 的 表格 中 ， 我 用 双 下 划 线 来 表示 哪个 属性 是 主 码 ， 
而 且 在 那 一 章 我 也 解释 了 码 、 主 码 ， 但 它们 都 应 用 于 关系 变量 而 不 是 关系 。 在 这 一 
章 和 第 4 章 中 ,我 也 给 出 了 很 多 表格 来 代表 关系 本 身 〈 我 的 意思 是 说 ， 对 于 某 些 关 
系 变量 ， 关 系 中 的 数据 可 能 与 样本 数据 不 同 )， 在 这 些 表 格 中 我 也 采用 了 这 种 惯用 





































































































表示 。 请 您 来 解释 一 下 这 种 惯用 的 表示 方法 ? 
5.2 ”考虑 下 面 Tutorial D 的 UPDATE 语句 ; 
UPDATE S WHERE CITY = 'Paris' : { STATUS := 30 } 
请 您 给 出 一 个 与 该 语句 等 价 的 关系 赋值 语句 。 提示 : 可 以 采用 EXTEND 的 路 
是 …… 又 怎么 样 ? ”版 本 。 
5.3 下面 TutorialD 的 表达 式 是 在 本 章 讨论 的 , 位 于 5.3 小 节 “ 了 映像 关系 ”部 分 : 
S WHERE ( !SP ) { PNO } =P { PNO } 
请 您 给 出 一 个 与 映像 关系 等 价 的 关系 表达 式 , 该 映像 关系 引用 在 WHERE 子 句 
中 (“ WP”)， 但 不 能 使 用 映像 关系 引用 本 身 。 
5.4 下 面 的 TutorialD 表达 式 的 含义 是 什么 ? 









































































































































a. P MATCHING 8S 

b. S NOT MATCHING ( SP WHERE PNO = 'P2' ) 
c. EXTEND P : { SCT := COUNT ( llSP ) } 
d. P WHERE SUM ( IlSP , QTY ) < 500 














5.5 采用 Tutorial D 表达 式 完成 下 面 的 查询 : 

a. 查询 供应 商号 码 ， 该 供应 商 所 在 城市 是 所 给 城市 字母 列表 中 的 第 一 
个 “假定 至 少 存在 一 个 供应 商 )。 

b. 查询 至 少 存在 两 个 供应 商 的 城市 名 称 。 
5.6 任意 给 出 一 个 “广义 约束 ” 它 可 以 采用 EXTEND 和 标准 的 约束 来 表示 。 







































































人 Ce 
5.6 ”答案 


5.1 要 考虑 两 种 情况 :(a) 描述 的 关系 是 某 个 关系 变量 R 的 样本 值 ，(b) 
述 的 关系 可 以 是 某 个 关系 表达 式 rx 的 样本 值 ， 这 里 rx 是 不 同 于 简单 关系 变量 应 用 
的 表达 式 回顾， 关系 变量 引用 基本 上 只 是 相应 的 关系 变量 名 )。 在 第 一 种 情况 下 ， 
双 下 划 线 只 是 简单 指示 出 主 码 PK 在 中 已 经 声明 ， 相 应 的 属性 是 PK 的 一 部 分 。 
在 第 二 种 情况 下 ,你 可 以 把 rx 看 作 是 为 某 些 临时 关系 变量 R 定 义 的 表达 式 ( 例 如 ， 
考虑 带 有 WITH 的 特殊 情况 )， 那 么 双 下 划 线 可 以 表示 主 码 PK 在 理论 上 说 是 为 关 
系 变量 尺 声 明 的 ， 其 属性 是 PK 的 一 部 分 。 

5.2 一 种 可 能 的 答案 如 下 : 







































































































































































S := ( S WHERE CITY #'Paris' ) 
UNION 
( EXTEND S WHERE CITY = 'Paris' : { STATUS := 30 } ); 


更 好 一 些 的 答案 可 以 表示 如 下 : 

















S := (SS WHERE CITY #'Paris' OR STATUS =- 30 ) 
UNION 
( EXTEND S WHERE CITY = 'Paris' AND STATUS * 30 ) : 
{ STATUS := 30 } ) ; 
附加 练习 : 在 什么 情况 下 可 以 说 后 面 的 答案 要 “上 略 胜 一 筹 ”? 

















5.3 首先 ， 给 出 整个 初始 表达 式 的 一 种 蔡 代 方式 是 很 方便 的 : 


S WHERE 








( SP MATCHING RELATION { TUPLE { SNO SNO } } ) { PNO } =P { PNO } 


解释 如 下 : 考虑 S 的 某 个 元 组 ， 假 设 供应 商 为 sx。 那么 针对 这 个 元 组 ， 表 达 


























式 TUPLE{SNO SNO} 的 含义 是 只 包含 SNO 值 为 Sx 的 元 组 (第 一 个 SNO 是 属性 
第 二 个 SNO 是 关系 变量 S 中 供应 商 Sx 属性 名 的 值 )， 所 以 ， 表 达 式 如 下 : 


RELATION { TUPLE { SNO SNO } } 



































名 ， 


它 表 示 了 只 包含 那个 元 组 的 一 个 关系 (事实 上 这 是 一 个 关系 选择 器 调用 ,参见 











第 7 章 )， 因 此 ， 表 达 式 如 下 : 


SP MATCHING RELATION { TUPLE { SNO SNO } } 


它 表 示 了 SP 的 某 个 子 集 ， 即 包含 一 些 供应 关系 元 组 的 子 集 ， 这 些 元 组 的 S 
























































关系 引用 “!! SP”。 
5.4 a. 位 于 同一 城市 的 供应 商 提供 的 零件 号 ; 
b. 没有 提供 零件 P2 的 供应 商 ; 









































c. 构成 了 PNO-PNAME_WEIGHT-COLOR-CITY-SCT 元 组 ， 其 中 PNO 的 值 



































供应 商 n 提供 ， 这 里 nn 是 SCT 的 一 个 值 。 
d. 所 供应 零件 总 重量 小 于 500 的 零件 号 。 
$5.5 a. ( S WHERE CITY = MIN ( S { CITY } ) ) { SNO } 
b. S { CITY } WHERE COUNT (IS ) > 工 

5.6 单独 的 一 个 例子 也 应 当 给 出 整体 的 思路 。 考 虑 下 面 的 表示 式 本章 












































NO 


值 与 Sx 的 SNO 相等 。 给 出 的 表达 式 ( 即 SP MATCHING…) 在 逻辑 上 等 价 于 映像 























经 提 过 ): 
S WHERE COUNT (!SP ) < 3 
它 可 以 等 价 于 如 下 形式 : 


( ( EXTEND S : { X := COUNT (SP ) } ) WHERE X < 3) { AL BUT XxX } 





第 6 章 


约束 和 断言 


具有 完整 性 和 一 致 性 你 的 学 分 才能 越 积 越 多 。 
摘自 中 国 福 饼 中 的 信息 〈2004 年 11 月 15 日 ) 






























































在 数据 库 领 域 中 ,约束 和 断言 是 有 区 别 的 ,但 也 是 相关 的 ， 同 时 ， 它 们 又 都 是 
很 重要 的 ,约束 用 来 保证 数据 库 中 的 数据 是 正确 的 , 断言 用 来 处 理 数据 的 真正 含义 。 
下 面 我 们 仔细 研究 一 下 。 


6.1 ”数据库 约 束 


在 第 3 间 中 我 第 一 次 提 到 数据 库 约 束 ， 虽 然 在 那 一 章 中 把 它们 称 为 完整 性 约 
束 。 不 严格 地 讲 ， 数 据 库 约 束 《〈 或 简称 为 约束 ) 就 是 一 个 结果 必须 为 TRUE 的 布尔 
表达 式 〈 因 为 它 的 结果 为 FALSE， 说 明 数 据 库 中 肯定 存在 了 错误 的 数据 )。 因 此 ， 
任何 修改 数据 库 的 请 求 如 果 使 得 约束 判断 结果 为 FALSE， 就 一 定 会 失败 。 在 关系 模 
型 中 ， 立 即 失 败 意味 着 只 要 有 修改 请 求 ， 就 会 产生 例外 情况 。 注 意 : 这 个 要 求 有 
时 被 称 为 指导 原则 (约束 破坏 会 立刻 被 检测 )。 可 以 立刻 看 到 这 个 规则 的 作用 结果 ， 
即 没有 一 个 用 户 曾 经 看 到 过 数据 库 处 于 一 种 不 一 致 的 状态 (不一致 的 状态 是 指 至 少 
有 一 种 约束 被 破坏 了 的 状态 )。 进 一 步 说 明 一 下 ， 不 一 致 状态 肯定 是 一 种 不 正确 的 
状态 ， 因 此 ， 它 不 可 能 与 真实 世界 中 的 实际 状态 一 致 。 我 将 在 本 章 末尾 来 讲解 这 一 
点 。 

































































































































































现在 , 我 来 讨论 第 3 章 介 绍 过 的 码 和 外 码 。 这 些 约束 是 相当 重要 的 ， 但 也 很 简单 。 
然而 ， 也 可 能 形成 任意 复杂 的 约束 ， 而 且 在 实际 中 也 可 能 发 生 (有 时 把 它们 称 为 商业 



































1 这 个 要 求 确实 是 很 明显 的 。 我 这 里 提 到 它 只 是 因为 有 时 确实 允许 修改 数据 库 的 一 种 状态 ， 即 使 这 个 
状态 是 不 正确 的 (我 们 将 会 在 本 书 第 三 部 分 看 到 解释 ), 而 且 ， 甚至 允许 用 户 看 到 这 个 不 正确 状态 。 
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规则 )。 首 先 ， 我 用 自然 语言 的 形式 给 出 几 个 约束 的 例子 ， 然 后 再 介绍 这 些 约束 在 
Tutorial D 中 如 何 表示 。 注 意 : 下 面 的 列表 与 第 3 章 给 | 




















1. 供应 商 的 状态 值 必须 在 1 至 100 之 间 。 
2. 伦敦 的 供应 商 状态 值 必须 为 20。 

3. 供应 商号 必须 是 唯一 的 。 

4. 状态 值 小 于 20 的 供应 商 不 能 提供 零件 P6。 
5. SP 中 的 每 个 供应 商都 必须 存在 于 S 中 。 



























































的 例子 相似 ， 但 不 完全 相同 。 





现在 我 们 考虑 这 些 约束 条 件 ( 或 商业 规则 ) 如 何 采 用 Tutorial D 的 形式 来 表示 。 











从 第 一 个 例子 开始 : 
1. 供应 商 的 状态 值 必须 在 1 至 100 之 间 。 
表达 式 为 : 




















CONSTRAINT CX1 IS EMPTY ( S WHERE STATUS < 1 OR STATUS > 100 ); 





























在 Tutorial D 中 ,约束 条 件 通 常 采用 CONSTRAINT 语句 来 表示 ， 就 像 例子 中 


给 出 的 ， 这 个 语句 由 三 部 分 组 成 : (a) 关键 词 CONSTRAINT;(b) 约束 的 名 字 ( 返 











回 错误 信息 时 或 引用 约束 时 使 用 ) 《〈c) 布尔 表达 式 ， 必 须 取 值 为 TRUE。 在 这 个 























例子 中 , 布尔 表达 式 的 实际 含义 是 如 果 我 们 把 供应 商 关 系 的 元 组 限制 为 状态 值 小 于 





































































































0 或 者 大 于 100， 那 么 这 个 限制 的 结果 就 是 空 集 〈 这 个 关系 变量 $ 的 值 是 结果 约束 





条 件 检测 的 )。 











顺便 提 一 下 , 如 果 检 测 约束 时 关系 变量 $ 恰好 是 空 的 , 会 发 生 什 么 昵 ? 《答案 ; 


这 个 约束 也 是 要 满足 的 。) 
























































实际 上 ， 还 有 另 一 种 方法 来 表示 前 面 的 约束 ， 这 种 方法 昌 有 些 争论 ， 但 从 直觉 
上 来 说 是 更 令 人 满意 的 (也 许 具有 更 好 的 用 户 友好 性 )。 














CONSTRAINT CX1 AND ( S , STATUS > 1 AND S1 


解释 如 下 。 














TATUS 























口 ”这 里 的 AND 是 聚集 运算 符 (我 在 第 5 章 曾 提 到 这 个 运算 符 ， 但 没有 给 出 
例子 )。 这 个 聚集 作用 于 布尔 值 。 在 这 个 例子 中 ， 聚 集运 算 符 包含 一 个 布 
尔 值 ， 该 值 来 自 于 供应 商 关 系 的 每 个 元 组 ， 由 布尔 表达 式 STATUS 1 
























































AND STATUS 和 100 判断 后 得 到 。 



























































k 体 的 表示 形式 如 下 : 





< 100 ) ; 




















口 “ 供 应 商 关 系 包含 了 SI1、S2、S3、S4 和 SS 的 元 组 ， 相 应 的 状态 值 分 别 为 
20、10、30、20 和 30。 因此， 相应 的 布尔 值 分 别 为 TRUE、TRUE、TRUE、 




















TRUE 和 TRUE。 

















口 现在 ， 当 且 仅 当 相 应 聚集 运算 中 所 有 值 都 为 TRUE 时 ，AND 返回 值 为 
TRUE， 就 像 此 题 给 出 的 例子 ， 每 个 供应 商 的 状态 值 都 在 所 给 范围 之 内 。 
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所 以 ， 这 种 替代 的 表示 方式 也 是 正确 的 “。 我 说 这 种 表示 方式 比 前 一 种 更 具有 
用 户 友好 性 的 原因 是 它 以 正确 的 方式 表明 了 要 满足 的 条 件 《〈 即 是 我 们 所 希望 的 方 
式 ， 这 个 状态 值 必须 在 一 个 特定 的 范围 内 )。 相 反 ， 前 面 的 那 种 表示 方式 是 以 一 种 
相反 的 方式 来 说 明 要 满足 的 条 件 ， 即 这 些 状态 值 不 能 处 于 什么 样 的 范围 。 
2. 伦敦 供应 商 的 状态 值 必须 为 20。 































































































表达 式 为 : 

CONSTRAINT CX2 IS EMPTY ( S WHERE CITY = 'London' AND STATUS #20 ); 
蔡 代 的 表示 方式 为 : 

CONSTRAINT CX2 AND ( S ，CITY :# London' OR STATUS = 20 ) ; 





可 以 在 两 种 表示 方式 中 任 选 其 一 。 
3. 供应 商号 必须 是 唯一 的 。 


CONSTRAINT CX3 COUNT ( S ) = COUNT (S { SNO } ) 


这 种 表示 方式 没有 明显 表示 出 我 们 所 要 求 的 条 件 , 但 实际 上 它 做 到 了 。 假设 关 
系 变量 $ 的 当前 值 为 s (当然 也 是 一 个 关系 )， 那 么 (a) 表达 式 COUNT (S) 的 就 是 
的 度 ;(b) 表达 式 COUNT (S{SNO}) 就 是 s 在 SNO 投影 的 度 ;(c) 约束 要 求 两 个 
度 要 完全 相等 。( 如 果 这 种 解释 还 不 是 很 明显 ， 即 要 求 两 个 数 相 等 其 实 等 价 于 要 求 
供应 商号 是 唯一 的 ， 那 就 要 根据 关系 变量 $ 中 的 样本 数据 来 进行 解释 了 。) 

实际 上 ， 我 们 几乎 可 以 肯定 的 是 这 个 例子 中 的 约束 条 件 其 实 不 用 采用 
CONSTRAINT 语句 来 说 明 ， 相 反 ， 可 以 在 定义 相应 关系 变量 时 采用 恰当 的 KEY 
语句 说 明 〈 就 像 例子 中 给 出 的 关系 变量 S)。 但 有 趣 的 是 ， 这 种 表示 方式 太 隐 长 了 ， 
因此 ， 有 时 采用 CONSTRAINT 这 种 简化 方式 。 

4. 状态 值 小 于 20 的 供应 商 不 能 供应 零件 P6。 


CONSTRAINT CX4 
IS EMPTY ( ( S JOIN SP ) WHERE STATUS < 20 AND PNO = 'P6' ) ， 


这 个 例子 中 涉及 了 两 个 不 同 的 关系 变量 S 和 SP。 通 常情 况 下 ， 一 个 约束 中 可 
能 涉及 一 些 不 同 的 或 不 相关 的 关系 变量 。 术 语 : 如 果 一 个 约束 中 只 涉及 一 个 关系 变 
量 , 则 称 为 单 变量 约束 ; 如 果 约 束 中 涉及 两 个 或 多 个 关系 变量 , 则 称 为 多 变量 约束 。 
(因此 ， 约 束 CX1 一 CX3 都 是 单 变 量 约 束 ， 而 CX4 是 多 变量 约束 。) 

5. SP 的 每 个 供应 商都 必须 存在 于 $ 中 。 


CONSTRAINT CX5 SP { SNO } ES { SNO },; 
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1 但 是 ， 当 检测 约束 条 件 时 ， 关 系 变量 S$ 恰好 又 为 空 ， 那 么 又 会 发 生 什么 情况 呢 ? 
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这 个 例子 中 也 涉及 了 多 变量 约束 。 更 重要 的 一 点 是 , 该 例子 中 的 约束 条 件 也 可 
以 不 使 用 CONSTRAINT 语句 表示 , 而 是 采用 FOREIGN KEY 的 形式 在 定义 关系 变 
量 时 说 明 (例如 该 例 中 的 SP)。 但 是 和 例子 3 一 样 ， 采 用 CONTRAINT 语句 说 明 
其 实 就 是 一 种 简化 形式 。 

对 于 约束 的 例子 说 明 就 到 此 为 止 。 但 关于 约束 的 讨论 不 仅仅 如 此 ， 其 实 还 有 很 
多 。 然而， 本 书 属于 介绍 性 的 一 本 书 ， 不 可 能 进行 深入 的 讲解 ， 所 以 我 在 本 书 中 没 
有 做 进一步 的 解释 说 明 。 可 以 在 SQL and Relational Theory 一 书 中 找到 对 这 个 主题 更 
详细 的 讲解 。 同 时 ， 对 于 特定 约束 更 加 详细 的 检测 又 称 为 依赖 〈dependencies) 即 
函数 依赖 或 联接 依赖 ), 该 部 分 内 容 可 以 在 我 的 另 一 本 书 中 找到 , 即 Database Design 
and Relational Theory: Normal Forms and All That Jazz (2012 年 ，O'Reilly 出 版 ) !。 

关于 多 重 赋值 的 解释 : 这 里 我 至 少 还 要 提 到 一 点 〈 虽 然 在 本 书 中 对 此 做 过 多 解 
释 不 太 合 适 ), 假设 供应 商 - 零 件数 据 库 具有 如 下 约束 ， 即 供应 商 S1 和 零件 P1 不 能 
位 于 同一 个 城市 中 (参看 本 章 练 习 6.3 的 e)， 那 么 ， 如果 供 应 商 S1 和 零件 Pl 当前 
都 位 于 伦敦 ， 下 面 的 UPDATE 操作 将 会 失败 : 


UPDATE S WHERE SNO = 'S1' : { CITY = 'Paris' }; 








































































































































































































UPDATE P WHERE PNO = 'P1l' : { CITY = 'Paris' }; 

为 了 同时 把 S1 和 P1 移 到 巴黎 ,可 以 说 我 们 需要 能 够 同时 修改 关系 变量 S 和 P。 
为 达到 此 目的 , 提供 了 一 个 多 重 赋 值 ,， 它 允 许 在 同一 个 语句 中 同时 对 多 个 不 同 的 变 
量 进行 修改 ， 形 式 如 下 : 


PDATE S WHERE SNO = 'S1' : { CITY : 
PDATE P WHERE PNO = 'Pl1' : { CITY : 


(注意 这 个 喜 号 分 隔 符 ， 它 表明 两 个 UPDATE 是 同一 个 语句 中 的 一 部 分 。) 当 
然 ， UPDATE 是 真正 的 赋值 ， 所 以 前 面 的 “两 个 UPDATE” 可 以 简写 为 如 下 的 两 
个 赋值 语句 : 

Si 

这 两 个 赋值 语句 把 一 个 值 赋 给 关系 变量 S$， 男 一 个 赋 给 关系 变量 了 P， 但 它们 是 
整个 操作 的 一 部 分 ， 直 到 整个 语句 结束 才 执行 完整 性 检查 《〈 即 直到 分 号 才 结束 )。 

现在 来 考虑 我 们 刚才 讨论 的 那个 约束 , 即 供应 商 S1 和 零件 Pl 不 能 位 于 同一 个 
城市 ， 它 实际 上 是 一 个 多 变量 约束 。 我 相信 你 也 明白 了 ， 上 面 讨 论 的 内 容 同样 适用 
于 很 多 这 样 的 多 变量 约束 , 但 不 完全 都 适用 。 例 如 , 他 们 肯定 适用 于 约束 条 件 CX4。 
关于 此 问题 的 进一步 讨论 ， 请 参见 SQL and Relational Theory 一 书 。 
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1 函数 依赖 (不 是 联接 依赖 ) 将 在 本 书 第 9 章 简要 介绍 。 





6.2 ”关系 变量 断言 


6.2 关系 变量 断言 


现在 我 


主题 的 本 质 是 采用 男 外 一 种 方式 来 考虑 变量 。 我 的 意思 是 说 ,大 部 分 





想 改 变 一 下 话题 ， 可 以 说 是 转向 本 章 
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的 另 一 个 大 的 主题 ， 即 断言 。 这 个 







































































j 户 都 只 把 关 








































































































































































































系 变 量 看 作 是 传统 计算 意义 上 的 文件 ， 相 反 ， 人 允许 它 是 抽象 文件 (遵守 规则 的 
[disciplined] 可 能 比 抽象 更 合适 )， 蛙 然 如 此 ， 但 它 仍 然 是 文件 。 只 是 我 们 以 另外 
种 方式 来 看 待 它 , 通过 该 方式 , 我 们 可 以 对 关系 变量 所 起 的 作用 有 更 深层 次 的 了 
解 ， 具 体 说 明 如 下 。 
敌 虑 供应 商 关 系 变 量 S$， 像 所 有 的 关系 变量 一 样 ， 假 设 这 个 关系 变量 是 真实 世 
界 中 的 某 些 值 。 实 际 上 ， 更 准确 一 点 说 ， 这 个 关系 变量 的 标题 表示 了 一 种 确定 的 断 
言 ， 其 含义 是 它 是 对 真实 世界 中 某 些 值 的 一 种 通用 表示 《说 它 是 通用 的 ， 是 因为 它 
是 参数 化 的 )。 刚 才 讨 论 的 这 个 问题 的 断言 如 下 : 





Supplier SNO is under contract, is named SNAME, has status STATUS, and is 
located incity CITY. 





























这 个 断言 就 是 对 关系 变量 S 的 预期 解释 。 换 名 话说 ， 也 可 以 称 为 内 涵 
(intension ) 。 
通常 情况 下 ， 你 可 以 把 断言 看 作 一 个 真 值 函数 。 像 所 有 的 函数 一 样 ， 它 有 一 系 
































列 的 参数 ， 当 被 调用 时 返回 一 个 结果 ， 该 结果 可 以 为 TRUE 或 FLASE。 例如 ， 上 
面 的 这 个 断言 参数 为 SNO、SNAME、STATUS 和 CITY (与 相应 关系 变量 的 名 称 


一 致 ), 它们 代表 了 相应 类 型 的 数值 (分别 为 CHAR、CHAR.、INTEGER 和 CHAR)。 
当 调 用 这 个 函数 时 (按照 逻辑 学 家 的 说 法 ， 是 初始 化 断言 ;， 我 们 用 变量 值 替 代 参 
数 ， 假 设 替 代 值 分 别 为 S1、Smith、20 和 London， 那 么 就 会 获得 如 下 的 语句 : 


Supplier 97 is under contract, is named Smith, has status 20, and is located in city 





London. 


这 个 语句 实际 上 是 




















一 个 合 


题 (proposition), 从 逻辑 上 来 说 , 它 的 值 






































要 么 为 真 ， 要么 为 假 。 下 面 给 出 儿 个 例子 : 


1. 


Barbara Kingsolver 撰写 了 The Poisonwood Bible。 


2. Jane Austen 撰写 了 The Poisonwood Bible。 


和 
第 一 个 





[si 


是 日 


命题 





真 的 ， 而 第 二 个 是 假 的 。 不 要 认为 命题 始终 


口才 





们 所 讨论 的 命题 都 假设 是 真 的。 解释 如 下 。 








predicate )。( 该 部 分 前 面 给 





首先 , 显然 每 个 关系 变量 都 是 与 之 相关 的 断言 , 称 为 关系 变 


- 旦 . 


清楚 的 ， 





都 是 真 的 ! 然而 ， 现 在 我 








断言 (remar 















































屋 





8 的 断言 就 是 关系 变量 $ 的 关系 变量 断言 。) 
关系 变量 RR 具有 断言 P， 那 么 在 某 个 时 刻 出 现在 R 中 的 每 个 元 组 1 都 可 以 
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约束 和 断 


中 












































这 种 方式 获得 的 断言 P 判 


被 看 作 是 表示 了 一 个 特定 的 断言 P， 该 断言 是 把 元 组 t 中 的 属性 值 作为 变 
量 值 调用 得 到 的 。 

口 ” (这 一 点 非常 重要 。) 按照 惯例 ， 我 们 假设 采 
断 结果 都 为 TRUE。 


还 是 以 关系 变量 中 的 样本 数据 为 例 ， 





此 时 ， 








假设 下 面 的 所 有 断言 都 为 TRUE: 


Supplier 97 is under contract, is named Smith, has status 20 and is located in city 


London. 


Supplier S2 is under contract, is named Jones, has status 10, and is located in city 


Paris. 


Supplier S3 is under contract, is named Blake, has status 30, and is located in city 


Paris. 


而 且 ， 我 们 进一步 讨论 ， 如 果 在 某 个 给 定 的 时 间 t， 某 个 特定 的 元 组 貌似 有 理 
该 出 现在 某 个 特定 的 关系 变量 ， 但 实际 上 没有 出 现 ， 











应 
言 就 是 错误 的 。 


TUPLE { SNO 








到 




















例如 下 面 的 元 组 : 


'S6' ， SNAME 'Lopez' , STATUS 30 ， 





GITY 


那么 我 们 在 时 间 # 的 丸 
































Pb 个 





'Madrid' } 


























它 貌 似 有 理 | 

















是 一 个 供 




















以 我 


应 商 元 组 ,但 











是 在 时 间 1 没有 出 现 帮 
门 有 权 假 设 下 面 的 这 个 断言 在 当时 就 是 错误 的 : 





E 关 系 变 量 S eh, 所 





Supplier S6 is under contract, is named Lopez, has status 30, and is [ocated in city 


Madrid. 
= 





对 应 的 P 的 初始 值 


一 个 给 定 的 关系 变量 在 
那些 值 为 真 的 断言 
采用 的 是 封闭 的 假设 区 域 。 下 面 给 出 定义 : 

定义 : 关系 变量 
Assumption，CWA) 指 的 是 〈a) 如 果 元 组 上 在 时 间 了 上 














或 者 至 少 我 们 在 实际 中 假设 为 真 的 断言 。 
































任意 给 定 的 时 间 包含 所 有 的 、 而 且 只 
换 名 话说， 我 们 实 氏 




















P 在 时 间 7 了 是 正确 


























但 在 时 间 7 了 没有 出 现在 RR 中 ,为 
换 各 话说 ,元 组 t 在 给 定 的 时 I 


R 的 断言 。 

更 多 的 术 i 
么 r (更 确 
它 的 扩 


五 ， 
: 


























里 ， 





切 地 说 ， 
展 是 随 着 

















司 出 现在 关系 变量 尺 中 ， 当 且 


仅 


AI 














包含 
未 上 


ER 具有 断言 已， 那么 封闭 的 假设 区 域 (The Closed World 
现在 R 中 ， 那 么 假设 与 t 
的 。 反 过 来 , (b) 如 果 元 组 1 与 R 的 标题 一 致 ， 
b 么 假设 与 1 对 应 的 P 的 初始 值 p 在 时 间 7T 是 错误 的 。 
它 在 那个 时 间 满 足 

















P 代 表 关 系 变 量 R 的 断言 ， 在 
是 r 中 的 内 容 ) 就 是 那个 时 间 P 的 扩展 ，， 
时 间 变 化 的 ， 但 是 内 涵 却 不 变 。 























三 


第 5 章 讨论 的 EXTEND 运算 符 无 关 。 





某 个 给 定 的 时 间 R 的 值 





为 关系 r， 那 














因此 ， 对 于 给 定 的 关系 


关系 与 类 型 
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综 上 所 述 ， 在 任何 给 定 的 时 间 ， 数 据 库 都 可 以 看 作 是 正确 断言 的 集合 ， 例 如 ， 


断言 Supplier S1 is under contract, is named Smith, has status 20 and is located in city 








London， 出 


应 的 元 组 的 






































事情 的 值 为 真 的 语句 。 


换 名 话说， 类 型 给 我 们 提供 了 词 
例如 ， 为 了 简化 ， 假 设 我 们 只 把 注意 力 放 在 供 
D 我 们 讨论 的 事情 
中 ， 我 们 的 词汇 表 通 常 比 这 个 要 大 ， 特 别 是 把 








来 的 时 候 ); 








我 们 可 以 说 的 东西 形 如 






































[ 表 ， 关 系 赋予 了 我 们 讨论 这 些 事情 
应 商 关系 上 ， 那 么 : 








可 以 是 字符 串 、 整 数 或 





“用 特 





规定 ， 供 应 商 名 字 采 用 字符 串 表示 ， 状 态 值 采 
字符 申 表示 ” 或 者 其 他 。 








采用 








这 个 事件 的 当前 状态 至 少 有 三 个 重要 的 推论 。 


的 某 个 部 分 。 
区 
们 就 不 能 说 具体 的 东西 。 












































现在 这 个 断言 中 的 变量 (如 S1、Smith、20、London) 都 恰好 是 与 其 对 
属性 值 ， 每 个 属性 值 都 是 具有 特定 类 型 的 值 。 它 遵循 如 下 规则 : 
类 型 是 我 们 讨论 的 相关 事情 的 集合 ; 关系 就 是 描述 我 们 要 讨论 的 





的 能 力 。 








他 当然 ， 在 实际 的 数据 库 





用 户 定 义 的 类 型 包括 进 





定 字 符 串 表 示 的 供应 商 




















j 整 


和 号 必须 符合 约束 的 
由 表示 ， 所 在 的 城市 


1 





, 
型 









































类 型 和 关系 都 是 必需 的 。 没 有 类 型 ， 我 们 就 不 能 讨论 事情 








k 体 地 说 ， 是 为 了 表示 真实 世界 





; 没有 关系 ， 我 














2. 类 型 和 关系 就 足够 了 ， 也 是 必须 的 。 从 逻辑 上 来 说 ， 我 们 不 再 需要 其 他 的 


了 '。( 为 了 反映 真实 世界 中 的 多 种 变化 , 我 们 确 
定时 间 的 状态 。) 

3， 类 型 和 关系 是 不 一 相 
看 作 是 关系 的 某 种 类 型 就 相当 于 让 非 关 系 








意 给 


性 \ 宫 


用 它 去 表示 任 












































实 需要 关系 变量 ， 


EF 的。 当心 那些 把 它们 混为一谈 的 人 ! 事实 上 ， 








是 我 们 不 需要 








ha 





把 类 型 














产品 去 执行 一 些 关 系 操作 (虽然 不 





特殊 




















说 明 ， 但 它们 通常 不 采用 这 样 的 术语 来 讨论 )。 很 明显 ， 建 立 在 这 种 迪 辑 错误 上 的 
任何 产品 注定 最 终 都 将 会 失败 。 




















下 面 再 从 

















较 规 范 的 角度 来 解释 一 下 上 面 押 讨论 的 事 : 





青 。 正 如 我 们 所 看 到 的 ， 








数据 库 可 以 被 看 作 是 值 为 真 的 断言 的 集合 。 事实 上 , 数据 库 与 运算 符合 在 一 起 就 是 

















一 个 好 辑 系统 ， 这 些 运算 符 被 赋予 表示 数据 库 的 那个 断言 。“ 逻辑 数据 库 ” 的 含义 





1 当 我 说 类 型 和 关系 是 必需 的 、 足 够 的 时 候 ，] 
要 其 他 的 结构 (如 指针 )， 这 是 因为 它们 的 设计 目标 不 同 ， 处 于 不 同 








库 中 需 

















然 已 经 超出 了 关系 模型 的 范围 。 


我 当然 要 提 到 第 1 


提 到 的 逻辑 数据 库 。 


显然 物理 数据 
的 级 别 上 。 物 理 模型 显 
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就 是 一 个 规范 的 系统 (如 欧 儿 里 得 几何 )， 我 们 可 以 利用 公理 (给 定 的 事实 ) 或 推 

时 规则 来 证 明 一 些 定理 (推导 出 的 事实 )。 这 些 都 来 自 于 Codd 伟 大 的 洞察 力 ， 他 在 

1969 年 发 明了 关系 模型 ， 证 明了 数据 库 并 不 真正 是 数据 的 集合 (虽然 名 字 叫 做 数 

据 库 ?， 相 反 ， 它 是 一 些 事实 的 集合 ， 或 者 称 为 断言 。 这 些 断 言 〈 也 就 是 说 ， 给 定 

的 断言 就 是 在 基本 的 关系 变量 中 由 元 组 表示 的 那些 ') 就 是 逻辑 系统 中 的 公理 。 推 

导 规 则 就 是 基本 的 规则 , 利用 这 些 规则 可 以 从 已 有 断言 中 推导 出 新 的 断言 。 换 名 话 

说 ， 这些 规则 告诉 我 们 如 何 使 用 关系 代数 中 的 运算 符 ， 因 此 ， 当 这 个 系统 要 判断 某 

些 关 系 表达 式 时 特别 是 要 对 某 些 查询 做 出 响应 )， 就 要 产生 一 些 新 的 规则 。 实 际 

上 ， 这 是 在 证 明定 理 。 
一 旦 你 理解 了 前 面 所 讲 的 ， 你 就 会 发 现 这 种 规范 逻辑 表示 可 以 用 来 解决 “数据 

库 问 题 ”。 换 名 话说 ， 形 如 下 面 的 问题 在 多 辑 操 作 上 都 是 可 以 接受 的 ， 都 可 以 给 出 

逻辑 答案 。 

口 “从 用 户 的 角度 看 ， 数 据 库 应 该 是 什么 样子 的 ? 

DD ”完整 性 约束 应 该 是 什么 样子 的 ? 

J ”查询 语言 应 该 是 什么 样子 的 ? 

”我们 应 该 怎样 最 好 地 实现 查询 ? 

”通常 情况 下 ， 我 们 如 何 更 好 地 评价 数据 库 表达 式 ? 

DD ”运算 结果 应 该 如 何 呈 现 给 用 户 ? 

D ”我 们 首先 应 该 如 何 设计 数据 库 ? 

现在 ,我 们 没有 说 关系 模型 可 以 直接 支持 前 面 的 概念 ， 这 是 因为 模型 是 坚 如 回 

石 的 、 正 确 的 ， 可 以 持续 的 。 另 外 也 因为 其 他 所 谓 的 “模型 数据 ”不 只 是 简单 的 在 

同一 个 范围 内 。 实 际 上 ， 我 一 直 有 个 疑问 ， 即 那些 其 他 的 模型 是 否 能 被 称 为 数据 模 

型 ,至少 不能 在 关系 模型 的 意义 上 这 样 来 命名 。 可 以 肯定 的 是 ,在 集合 理论 和 断言 

的 逻辑 上 ， 它 们 中 的 绝 大 部 分 都 是 可 以 作为 关系 模型 的 ”。 


6.3 断言 与 约束 


断言 和 约束 两 个 概念 之 间 有 联系 吗 ? 我们 再 次 考虑 一 下 关系 变量 $ 的 断言 : 
Supplier SNO is under contract, is named SNAME, has status STATUS, and is 



















































































































































































































































































































































































































































































1 回顾 第 3 章 ， 基 本 关系 变量 就 是 可 以 单独 存在 的 关系 变量 ， 不 能 由 其 他 关系 变量 来 定义 。 像 S、P 

和 SP 都 是 基本 关系 变量 。 
2 虽然 集合 理论 的 相关 性 很 明显 ， 但 这 是 我 第 一 次 在 本 书 中 提 到 集合 理论 和 断言 逻辑 〈 参 见 附录 C)， 
至 于 断言 逻辑 ， 可 以 参见 附录 D。 













































































located in 
city CITY. 








这 个 断言 是 专门 为 关系 变量 S 解释 的 。 在 理想 的 世界 里 , 它 可 以 作为 修改 关系 
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变量 的 一 个 可 以 接受 的 标准 。 也 就 是 说 , 它 可 以 决定 在 关系 变量 S 上 进行 的 修改 是 
否 可 以 被 接受 。 但 是 这 个 目标 是 不 能 实现 的 。 














口 “ 一 个 原因 是 ， 系 统 不 能 识 另 





城市 名 London 恰好 同时 出 




















外 "一 个 供应 商 ” 是否“ 遵守 协议 ”或 者 “位 于 














哪里 ”的 基体 含 义 ， 即 这 是 由 解释 来 负责 的 。 例 如 ， 如 果 供 应 商号 S1 和 











现在 同一 个 元 组 中 , 那么 用 户 就 可 以 做 出 解释 ， 











即 供应 商 Sl 位 于 伦敦 ， 或 














者 供应 商 S1 经 常 位 于 伦敦 ， 或 者 供应 商 S1 在 






































没有 办 法 完成 类 似 事 情 的 。 


伦敦 有 办 公 室 ， 再 或 者 供应 商 S1 在 伦敦 有 房产 ， 或 者 任意 其 他 可 能 的 解 
释 〈 当 然 ， 要 与 可 能 的 关系 变量 断言 的 无 限 的 数量 相对 应 )， 但 是 系统 是 



































口 “ 另 一 个 原因 是 ， 即 使 系统 知道 供应 商 应 遵守 协议 或 位 于 哪里 等 的 具体 含 
义 ， 但 它 仍然 不 知道 这 个 前 提 条 件 ， 即 用 户 所 说 的 是 否 是 真 的 ! 如 果 用 户 


















































约束 的 破坏 。 假 设 不 是 这 检 


通过 修改 操作 保持 系统 的 一 致 性 ， 例 如 ， 供 应 商 S6 名 字 叫 做 Lopez， 状 
态 值 为 30， 所 在 城市 为 Madrid， 那 么 系统 也 没有 办 法 知道 这 个 断言 是 否 
是 真 的 。 系 统 能 够 做 的 所 有 的 事情 是 检测 用 户 的 断言 不 能 引起 任何 完整 性 


















































的 话 ， 系 统 就 会 接受 用 户 的 断言 ， 会 从 那 一 时 











刻 开始 把 它 看 作 是 真 的 (直到 这 时 用 户 才 会 通过 执行 另 一 个 修改 操作 来 告 
诉 系统 ， 这 个 断言 不 再 是 真 的 )。 
因而 ， 与 理想 的 情况 相反 ， 修 改 可 以 被 接受 的 实际 标准 不 再 是 断言 ， 而 是 与 之 












































相应 的 约束 集合 , 这 些 约束 可 以 被 看 作 是 相应 断言 的 一 种 近似 表示 ,等 价 的 说 法 为 : 





系统 不 能 加 强 真 理 ， 














而 是 要 加 强 一 致 性 。 





令 人 遗憾 的 是 ， 真理 和 一 致 性 不 是 一 回 事 。 具体 地 说 ， 如 果 数 据 库 会 包含 真 的 
断言 ， 那 么 它 就 是 一 致 的 ， 但 反 过 来 不 一 定 是 这 样 。 相 似 地 ， 如 果 它 不 一 致 ， 那 么 














它 至 少 包含 一 个 错误 的 断言 ,但 反 过 来 不 一 定 是 这 样 。 或 者 换 一 种 说 法 ， 正 确 就 瞳 
含 着 一 致 性 ， 不 一 致 就 暗含 着 不 正确 ， 那 么 : 
DD 数据库 是 正确 的 ， 就 是 指 它 能 够 真实 地 反映 出 真实 世界 中 的 事件 的 正确 























状态 
7GAN 3 








6.4 练习 



























































口 “ 相 反 ， 数 据 库 是 一 致 的 ， 只 是 说 它 没 有 破坏 任何 已 知 的 完整 性 约束 。 


6.1 针对 关系 变量 P 和 SP， 给 出 一 些 合理 的 断言 。 
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6.2 考虑 本 章 给 


CX1: 
CX2: 
CX3: 
CX4: 
CXS 3 


案 ， 例 如 ， 针 对 约束 CX1 的 操作 , “在 S 
6.3 ”针对 下 面 的 商业 规则 ， 写 出 






































供应 商号 必须 是 唯一 的 。 


状态 值 小 于 20 的 供应 商 
SP 的 每 个 供应 商都 必须 存在 于 S 中 。 
哪些 操作 有 可 能 会 破坏 这 些 约束 ? 注意 : 








的 约束 CX1 至 CX5: 
供应 商 的 状态 值 必 须 在 1 至 100 之 间 。 
伦敦 供应 商 的 状态 值 必须 为 20。 





不 能 供 
































进行 提 























a. 所 有 红色 零件 的 重量 必须 大 于 50 傍 。 





0 
































Se 














心间 。 
F P1 必须 位 于 同一 个 城市 。 





个 供应 商 位 于 雅典 


re 


入” 




















应 零件 P6。 





.不 能 出 现 两 个 供应 商 位 于 同一 个 城市 的 情况 。 
在 任何 时 候 ， 最 多 只 能 有 一 
， 至少 存在 一 个 伦敦 的 供 
.供应 商 S1 和 零 们 


























不 必用 非常 准确 的 形式 给 出 你 的 答 
作为 答案 这 就 足够 了 。 
供应 商 - 关 系数 据 库 的 CONSTRAINT 语句 : 





6.4 在 关系 变量 $ 当前 值 上 ， 对 除了 CITY 外 的 所 有 属性 进行 投影 ， 这 个 投 


影 包 含 了 所 有 形 如 (sno,sn,st 























一 个 与 如 下 形式 对 应 的 断言 : 
Supplier SNO is under contract, is named SNAME, has status STATUS, and is 
located somewhere 

















供应 商 可 能 位 于 茶 个 城市 ， 
注意 ， 这 个 断言 有 说 哪个 参数 与 投影 中 的 三 个 属性 术 











晶 我 们 不 知道 具体 的 城市 。 


) 的 元 组 ， 这 样 的 元 组 来 自 于 关系 变量 S 的 元 组 
(sno,sn,st,sc)( 我 已 经 尽量 简化 地 来 解释 这 些 概 念 )。 换 句 话说 ,讨论 的 这 个 投影 有 

















日 对 应 。 




















类 似 的 结论 可 应 用 于 所 有 可 能 的 关系 表达 式 中 。 换 名 话说 ， 它 不 只 是 具有 断言 
|， 对 于 给 定 关 系 表达 式 


的 关系 变量 ， 相 反 ， 每 个 关系 表达 式 都 有 一 个 断言 。 而 是 
的 断言 可 以 一 直 | 





a. ( S 












































JOIN P ) { BENO ， 


b.P MATCHING 8S 


c.S NOT MATCHING ( SP WHERE 





d. EXT 





END P : { SCT := C 





e.PW 























算 符 的 语义 一 致 。 请 给 出 下 面 表达 式 的 断言 : 


SNO } 














OUNT 


HERE SUM ( llSP , QTY ) 











1 实际 上 ， 用 户 可 能 还 没有 意识 到 这 个 














果 ( 可 以 采 

















Tutorial D 或 其 他 语言 书写 查询 )。 





PNO = 
( SP 
< 500 








表达 式 中 涉及 的 关系 变量 的 断言 决定 , 其 语义 与 表达 式 





'P2'! ) 


) 


} 











FP 关系 运 





事实 ， 他 们 写 出 一 个 规范 的 查询 之 后 ， 就 要 解释 这 个 查询 的 结 


6.5 


6.1 


6.2 


CX1: 
CX2: 
CX3: 


CX4 


CX5: 


6.3 


a. CONSTRAINT CXA AND 
b. CONSTRAINT CXB COUNT 
c. CONSTRAINT CXC 
d. CONSTRAINT CXD IS NOT ] 


在 本 章 开头 ， 我 曾经 声明 “ 
见 的 吗 ?如 果 它 被 破坏 的 话 ， 可 
































黄金 法 则 ”是 显而易见 的 ， 但 真 的 是 显 而 易 
能 会 出 现 什么 状况 ? 


关系 变量 P 的 断言 : Part PMO is named PNAME, has color COLOR and 
weight WEIGHT, and is stored in city CITY. 
关系 变量 SP 的 断言 : Supplier SNO supplies part PNO in quantity OTY. 





答案 如 下 : 


INSERT on S, UPDATE on STATUS in S 
INSERT on S, UPDATE on STATUS or CITY in S 
INSERT on S$, UPDATE on SNO InS 


: INSERT on SP UPDATE on SNO or PNO in SP, INSERT on S$, UPDATE on 


STATUS inS 


答案 如 下 : 








COUNT ( 


e. CONSTRAINT CXE COUNT ( 


6.4 





答案 如 下 : 











a. 供应 商 SNO 和 零件 PNO 属 卫 
F PNO 的 名 称 为 PNAME,， 


b. 零 伯 























市 CITY， 并 且 只 能 由 一 个 供应 商 来 供应 。 














( P , COLOR = 'Red' AND WI 
(S{SNO}) = COUNT (S { CITY } ) 
S WHERE CITY = 'Athens' ) < 2 | 
































EIGHT < 5250.0 ) 


INSERT on SP, UPDATE on SNO in SP DELETE on S, UPDATE on SNOINS 


9 


9 


9 


EMPTY ( S WHERE CITY = 'London' ) ; 


( S WHERE SNO = 'S1' ) { CITY } 








UNION 











( P WHERE PNO ='P1' ) { CITY } ) <2 














c. 供应 商 SNO 遵守 一 定 协议 ， 名 字 为 SNAME， 状 态 值 为 STATUS， 











和 CITY， 但 不 提供 零 





件 P2。 


d， 零件 PNO 的 名 称 为 PNAME， 






































和 CITY， 由 供应 商 SCT 来 供应 。 





e. 零件 PNO 的 名 称 为 PNAME， 








1 也 许 更 确切 地 说 ， 零 件 PNO 是 用 在 企业 中 的 ， 无 论 是 什么 企业 均 可 ， 


















































同一 个 城市 ; 
频 色 为 COLOR， 重 量 为 WEIGHT， 
颜色 为 COLOR， 重 量 为 WEIGHT， 
频 色 为 COLOR， 重 量 为 WEIGHT,， 
PNAME 也 是 如 此 。 


位 于 城 


位 于 城 





位 于 城 


位 于 城 


88 第 6 章 约束 和 断言 


























市 CITY， 由 供应 总 量 大 于 500 的 供应 商 来 提供 。 
注意 : 这 个 练习 只 是 对 前 面 章 节 的 练习 更 规范 的 一 种 表示 (如 第 4 章 的 练习 4.6) 
6.5 ”真理 即 为 : 我 们 从 不 相信 从 不 一 致 的 数据 库 中 取得 的 答案 。 下 面 给 出 这 
个 事实 的 证 明 过 程 (该 部 分 的 讨论 主要 基于 SOL and Relational Theory 一 书 )。 我 们 
知道 ， 数 据 库 可 以 被 看 作 是 断言 的 集合 。 假 设 这 个 集合 是 不 一 致 的 ,那么 假设 采用 


















































ll 











明显 的 或 暗示 的 方式 说 明了 一 些 断 言 p 和 它 的 反 向 结果 NOTp 都 是 正确 的 , 9 表示 
任意 的 断言 ， 那 么 : 
从 真理 p 中 我 们 可 以 推断 出 真理 p 或 gq。 

从 真理 或 g， 或 NOTp， 我 们 可 以 推测 出 真理 9。 

但 g 是 任意 的 ! 即 无 论 什么 情况 下 , 在 一 个 不 一 致 的 系统 中 任意 断言 都 可 以 视 
为 是 “ 真 ” 的 〈 即 使 这 个 断言 很 明显 是 错误 的 ， 如 1=0)。 
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第 7 章 


关系 模型 


关系 模型 : 规范 的 信息 ! 
一 一 Anon: Where Bugs Go 











这 是 本 书 第 一 部 分 的 最 后 一 章 。 在 前 面 的 章节 中 , 我 已 经 描述 了 关系 型 DBMS 
的 大 部 分 特征 〈 至 少 从 关系 型 的 视角 来 看 ， 这 些 特 征 是 比较 重要 的 )。 现 在 我 们 复 
习 一 下 这 些 特征 ， 并 把 它们 综合 在 一 起 来 定义 关系 模型 ， 以 此 来 解释 这 些 特征 的 具 
体 食 义 。 有 一 点 要 提醒 的 是 ， 术 语 关 系 模型 (relational model) 本 身 来 自 于 Codd 
的 一 篇 著名 的 论文 题目 4 Relational Model of Data for Large Shared Data Banks 
(CACM13， 第 6 期 ，1970 年 6 月 )， 此 篇 论文 在 附录 A 中 有 详细 介绍 。 


7.1 关系 模型 定义 


我 不 知道 你 是 否 注意 到 了 , 在 该 章 之 前 我 故意 没有 给 出 关系 模型 的 确切 定义 ， 
尽管 我 在 许多 场合 似乎 提 到 了 这 个 概念 ， 比 如 : 
DD ”关系 模型 没有 元 组 级 的 运算 符 ; 

关系 模型 禁止 使 用 指针 ; 
DD ”关系 模型 需要 立即 进行 完整 性 检测 。 

我 真正 给 出 的 最 相近 的 定义 是 在 第 1 章 ， 把 关系 模型 描述 成 一 个 用 户 接口 ， 这 
是 事实 ， 但 它 也 不 能 作为 一 个 确切 的 定义 。 现 在 ， 我 把 关系 模型 看 作 是 DBMS 的 
一 个 抽象 的 外 部 说 明 ， 但 在 有 些 华而不实 的 语言 中 仍然 采用 “接口 ”的 定义 。 我 们 
尤其 注意 到 ， 这 两 个 定义 都 没有 明确 说 明 给 定 的 DBMS 是 否 是 关系 型 的 。 
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1 有 趣 的 是 ,尽管 Codd 在 1970 年 发 表 的 论文 标题 给 出 了 关系 模型 , 但 实际 上 并 没有 真正 给 出 关系 模 
型 的 定义 。 
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上 E 
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实际 上 ， 从 直觉 上 来 说 , 我 把 它 看 作 是 一 种 可 以 简单 而 简洁 解释 说 明 的 分 量 最 
































E 的 一 种 模型 (即使 已 经 定义 了 )。 为 了 支持 这 个 论点 ， 考 虑 下 面 这 个 经 过 简单 编 











辑 后 的 文本 ， 这 个 是 我 写 的 一 个 网 页 ， 描述 了 Codd 的 背景 及 贡献 ， 并 对 他 在 1981 
年 获得 的 ACM 图 灵 奖 给 出 了 解释 (http:/amturing.acm.org/award_winners/codd_ 
1000892.cfn)。 


多 页 的 篇 幅 来 描述 它 的 深奥 , 我 的 做 法 肯定 不 是 很 彻底 的 。 因 为 即使 过 去 了 这 么 
年 ， 我 仍然 发 现 了 一 些 结果 和 新 的 含义 〈 当 我 在 1970 年 阅读 Codd 的 论文 时 ， 



































数据 的 关系 模型 


实际 上 ， 数 据 的 关系 模型 是 对 数据 库 中 数据 的 一 种 规范 而 严格 的 定义 ， 即 数据 呈现 给 
用 户 时 是 什么 样子 的 。 例 如 ， 它 是 用 户 与 数据 库 系统 之 间接 口 的 一 种 抽象 的 说 明 。 换 匈 话 
说 ， 数 据 库 系 统 是 关系 型 的 ， 当 且 仅 当 它 支持 的 用 户 接口 真正 实现 了 关系 模型 。 就 这 样 的 
用 户 系统 而 言 ， 应 该 满足 : (a) 数据 看 上 去 是 关系 型 的 ; (b ) 像 联接 (join ) 这 样 的 关系 运 
算 符 应 该 可 以 作用 于 关系 型 的 数据 。 


数据 看 上 去 是 关系 型 的 


关系 在 纸 上 可 以 表示 为 简单 的 具有 行 和 列 的 表格 。 因 此 ， 不 严格 地 说 ， 用 户 可 以 采用 
这 样 的 表格 形式 来 看 待 数 据 。 


可 用 的 关系 运算 符 


关系 运算 符 就 是 可 以 从 给 定 的 关系 中 再 产生 新 的 关系 的 运算 符 。 因 此 关系 可 以 被 看 成 
是 表格 ， 所 以 我 们 可 以 把 这 些 运算 符 看 作 是 对 表格 进行 的 “ 剪 切 和 粘贴 ”操作 。 例 如 ， 给 定 
一 个 员工 信息 表格 ， 限 制 (restrict ) 运算 就 是 根据 给 定 的 工资 裁剪 掉 某 些 员工 的 行 。 如 果 再 
给 出 一 个 部 门 信息 表格 ， 联 接 (join ) 运算 符 就 是 把 员工 的 部 门 信息 与 员工 信息 粘贴 在 一 行 中 。 
实现 

为 关系 型 系统 的 用 于 接口 与 系统 内 部 数据 的 存储 和 操作 方式 完全 不 同 ( 要 比 系 统 内 
部 的 方式 简单 一 些 )， 所 以 在 实现 时 会 面临 很 多 挑战 。 早 在 20 世纪 70 年 代 研 究 人 员 就 已 经 
开始 研究 这 个 问题 了 ， 不 久 ，Codd 发 表 了 他 的 第 一 篇 论文 ， 许 多 的 原型 都 是 在 20 世纪 70 
年 代 提 出 的 。20 年 后 出 现 了 第 一 个 商业 化 产品 。 然 而 不 幸 的 是 ， 即 使 到 现在 ， 也 没有 一 个 
商业 化 产品 能 够 真正 实现 Codd 的 最 初 想法 , 但 它们 很 快 就 主宰 了 市 场 。 由 于 关系 模型 是 建 
立 在 稳 国 的 集合 理论 和 规范 逻辑 基础 上 ， 至 今 它 仍 然 存在 ， 而 且 能 接受 时 间 的 考验 。 
虽然 关系 模型 被 定义 得 很 简单 ， 但 它 还 是 很 深奥 的 。 别 筷 了 ， 我 已 经 用 了 一 










































































法 黄豆 




















一 次 听 说 了 关系 模型 )。 简 言 之 ， 我 仍然 是 在 学 习 过 程 中 。 
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因此 ， 在 本 章 我 想 要 给 出 关系 模型 的 更 确切 的 定义 。 但 麻烦 的 是 ， 我 给 出 的 定 
义 真 的 是 很 准确 的 吗 ? 所以, 事实 上 , 我 认为 要 理解 第 1 章 给 出 的 定义 是 非常 困难 
的 。( 这 就 是 我 为 什么 没有 做 任何 事情 的 原因 。 就 像 Bertrand Russell 说 过 的 值得 纪 
念 的 一 句 话 “作品 或 者 通俗 易 懂 、 或 者 严格 续 密 ， 但 不 能 同时 做 到 ” ) 所以， 我 给 
出 定义 后 ， 要 必须 花费 大 量 篇 幅 来 加 以 解释 。 

不 再 多 费 周 折 ， 下 面 是 我 给 出 的 定义 : 

定义 : 关系 模型 由 以 下 5 个 部 分 组 成 : 

类 型 的 集合 ， 该 集合 是 开放 的 ， 并 且 是 闭 集 。 尤 其 包括 BOOLEAN 类 型 。 
关系 类 型 产生 器 ， 以 及 对 产生 类 型 的 详细 解释 。 
定义 关系 变量 的 工具 ， 这 些 关系 变量 的 类 型 是 由 关系 类 型 产生 器 确定 的 。 
关系 赋值 运算 符 ， 可 以 把 关系 值 赋 给 确定 的 关系 变量 。 
从 关系 上 说 ， 是 完整 的 ， 但 是 开放 的 通用 关系 运算 符 的 闭 集 ， 这 些 运算 符 
可 以 从 其 他 关系 值 产 生 新 的 关系 值 。 

下 面 按 次 序 来 解释 这 几 个 部 分 。 但 首先 要 注意 一 点 ，John Muir 曾经 说 过 ， 当 
我 们 试图 从 事物 本 身 找 出 什么 的 时 候 ， 就 会 发 现 它 与 宇宙 中 的 一 切 都 有 联系 〈 经 常 
以 这 种 形式 引用 “任何 事物 都 与 其 他 事物 有 联系 ”)。 当 然 John Muir 是 在 讨论 自然 
界 , 但 他 也 一 直 在 谈论 关系 模型 ， 即 关系 模型 的 各 个 特征 之 间 是 高 度 关联 的 ， 删除 
其中 任何 一 个 ， 整 个 结构 就 会 被 破坏 。 采用 术语 解释 的 话 ， 这 个 隐喻 的 含义 就 是 如 
果 我 们 建立 的 “关系 型 ”系统 不 能 支持 该 模型 的 某 个 方面 ， 那 么 这 个 系统 〈 也 许 不 
能 把 它 称 为 真正 的 关系 型 系统 ) 就 不 能 解释 某 些 场合 的 一 些 行 为 ， 这 肯定 是 我 们 不 
希望 发 生 的 ， 但 也 不 是 不 能 预见 的 。 对 于 该 点 我 不 能 强调 太 多 ， 模 型 中 的 每 个 特征 
都 有 它 存在 的 实际 原因 ， 如 果 我 们 忽略 任何 一 个 ， 就 是 在 给 自己 找 麻 烦 。 































































































































































































nn 上 Di 一 





































































































































































































7.2 ”类 型 








再 重复 一 过 ，5 个 部 分 中 的 第 一 个 特征 是 “类 型 的 集合 ， 该 集合 是 
且 是 闭 集 。 尤 其 包括 BOOLEAN 类 型 ”。 关 系 模型 中 肯定 是 需要 类 型 的 ， 因 为 关系 
是 定义 在 类 型 的 基础 上 的 。 每 个 关系 的 每 个 属性 都 属于 某 种 类 型 ， 因 此 ， 每 个 关系 
变量 也 应 该 属于 菜 种 类 型 。 
日 也 要 特别 注意 ,关系 模型 并 没有 说 存在 什么 类 型 〈 只 是 特别 提出 了 BOOLEAN)。 



















































































1 顺便 说 一 下 , 一 定 要 注意 这 个 明确 的 冠 词 We relational model, 即 特 指 关系 模型 , 仅仅 有 这 一 种 表示 ! 
一 些 批评 家 有 时 会 建议 说 , 关系 型 的 提倡 者 (这 其 中 要 包括 我 自己 ) 也 在 改变 这 个 定义 , 改变 规则 。 
为 此 ，2006 年 我 发 表 了 论文 There Only One Relational Model， 对 这 种 批评 做 出 了 回应 。 
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通常 会 有 
串 


种 误解 ， 认 为 关系 模型 





























只 能 处 理 一 些 相当 简 间 








的 类 型 ， 如 数值 型 


[= ga 


、 子 付 











、 日 期 型 、 时 间 型 等 等 ， 








这 些 属性 可 以 具有 任何 类 型 〈 











模型 本 身 是 正 交 的 。 
现在 ， 开 始 讨论 类 型 。 

















我 划 











他 的 著作 中 ， 我 经 常用 术 i 


这 是 很 不 幸 的 。 
除了 下 面 列 ! 

















这 中 


讨论 更 多 的 是 标量 类 型 











但 实际 上 关系 和 关系 变量 都 具有 
的)。 换 名 话说 ， 支 持 类 型 与 支持 关系 


(scalar type)〈 实 际 上 ， 在 
香 标 量 类 型 [scalar type] 来 代替 类 型 [type])。 那 么 








属性 ， 











到 底 什 么 是 标量 类 型 呢 ? 不 严格 地 讲 ， 如 果 没 有 用 户 可 见 的 部 分 ， 它 就 是 标量 的 ， 








否则 就 是 非 标量 的 。 根 
属性 、 符 、 











六 


运 

















据 类 型 
参数 和 表达 式 。 例 如 : 
类 型 INTEGER 是 标量 的 〈 它 没有 
值 、 变 量 等 等 也 都 是 标量 的 。 














T 本 身 是 否 是 标量 的 来 而 











有 


















































关系 类 型 是 非 标量 的 《具有 与 相应 属性 一 致 的 用 户 可 见 部 分 )， 

















系 的 值 、 变 量 等 等 也 都 是 非 标量 的 。 注 意 ， 元 组 类 型 、 
量 的 (回顾 第 2 章 练习 2.7 的 答案 )。 
现在 必须 强调 一 点 : 前 面 的 概念 实际 上 是 不 规范 的 、 也 不 精确 的 ， 然 而 对 于 直 


因 是 有 一 些 类 型 实际 上 很 难 确定 是 标量 还 是 非 标 





























的 理解 是 有 








帮助 的 。 一 部 分 原 








。( 例 如 ， 





字符 品 或 者 单亲 











定 该 类 








型 了 的 值 、 变 量 、 





户 可 见 的 部 分 )。 因 此 ，INTEGER 的 





因此 该 关 
值 和 变量 也 是 非 标 









































'。 为 了 达到 前 面 的 





目 












































的 字符 都 是 有 用 户 可 见 的 部 分 组 成 的 。) 针对 这 样 的 原 




















,无论 在 何 处 , 关系 模型 都 信赖 采用 规范 形式 表示 的 标量 与 非 标 量 类 型 之 间 的 区 




















综 江 团 乳癌 





之 外 的 任何 类 型 ， 


也 可 以 采用 术语 非 标量 

















的 ， 你 可 以 采用 术语 标量 (scalar) 来 表示 除 元 组 合 关系 类 
(nonscalar) 代表 元 组 或 关系 类 型 。 





除 


此 之 外 ， 你 可 以 采用 术语 类 型 来 特别 表示 标量 类 型 ， 除 非 有 显 式 的 声明 。 














现在 ， 标量 类 型 可 以 是 一 个 站 








统 , 也 可 以 是 用 户 定义 的 。 























可 以 定义 自己 的 标量 类 型 。 











用 户 也 可 以 定义 自己 的 运算 符 ， 




















是 不 能 使 用 的 。 至 于 系统 已 定义 的 类 型 ， 这 个 类 型 集合 中 需要 包括 
是 最 基本 的 类 型 之 一 ， 只 有 2 个 值 ， 即 TRUE 和 FALSE), 但 
要 支持 其 他 的 类 型 ， 



































的 、 返 回 布尔 值 的 运算 符 。 








可 用 于 与 任何 类 型 的 联接 运算 
我 们 甚至 不 能 说 构成 这 些 类 型 的 值 都 是 什么 。 而 | 








特别 是 











因而 , 对 于 
因为 没有 运算 符 的 类 型 

















I 户 来 说 ， 

















BOOLEAN ( 它 























个 实际 的 系统 中 还 





如 INTEGER、CHAR 等 。 支持 BOOLEAN 的 含义 就 是 支持 通 


的 连接 词 (如 逻辑 运算 符 AND、OR、NOT 等 ) 以 及 其 他 的 、 








系统 或 用 户 定义 























是 , 等 价 比 较 运 算 符 “=”( 它 也 是 一 个 布尔 运算 符 ) 


PF， 它 既是 非 标量 类 型 也 是 标量 类 型 ， 





因为 没有 它 ， 




















1 这 就 是 我 为 什么 没有 在 前 面 章节 提 到 这 个 


口 Aor 

















日 ， 模 型 还 规定 了 这 个 运算 符 的 i 











五 
上 


久别 的 原因 。 实 际 上 我 只 是 两 次 简单 地 提 到 了 术语 标量 




















讨论 标量 标识 符 ， 





(scalar)， 一 次 是 在 第 3 


而 且 我 从 没 提 到 过 非 标 量 (nonscalar)。 

















次 是 在 第 4 章 提 到 标量 运算 符 ( 但 只 是 在 脚注 中 )， 














义 : 如 果 v1 和 v2 具有 相同 的 值 “它们 的 类 型 必须 相同 )， 那 么 等 式 v1=v2 就 返回 
否则 返回 FALSE。 


TRUE， 























正确 
































7.3 ”关系 类 型 产生 器 93 


























现在 我 们 已 经 得 出 建议 ， 关 系 和 关系 变量 可 以 


的 。 事 实 上 《就 像 第 2 章 练习 2.7 的 答案 )， 会 有 两 种 例外 ， 首 先 ， 在 数据 库 

















有 任何 类 型 的 忆 





Ez 
EE 


可 


性 不 是 100% 





所 








中 关系 变量 和 关系 不 允许 具有 指针 类 型 ， 第 二 ， 如 果 关 系 x 具有 标题 互 ， 那 么 就 不 
能 依据 具有 同样 标题 卫 的 元 组 或 关系 类 型 来 定义 7 的 属性 。 














最 后 ， 要 注意 的 是 与 每 个 类 型 
少 存在 一 个 选择 器 运算 符 (说 明 这 











解 ， 也 不 重要 )。 选 择 器 是 只 读 运算 符 ， 


返回 类 型 为 了 的 值 ; 
地 说 ， 是 通过 相应 的 标识 符 。 污 
给 定 任意 类 型 7， 必 





(b) 

















须 能 写 


类 型 





下 


T (无 ; 
一 点 主 


的 每 个 


要 











i 
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是 为 了 














在 


如 下 




















讽 


















































纳 有 陛 与 


SOL and Relational Theory。 


7.3 关系 类 型 产生 


模型 的 第 2 部 分 是 关系 类 型 产生 器 ， 以 及 对 产生 类 型 的 详细 
中 第 一 个 词 提 到 术语 类 型 产生 器 (type generator)， 所 以 我 #9 








个 术语 。 类 型 


4 产生 器 基本 上 只 是 一 利 
返回 一 个 类 型 ， 


第 


bE 


1 半 图 





VAR AAA 














口 
AA 





1.3 





RRAY [1..N] 








OF INTEGER ; 





而 不 是 一 个 值 ; (b) 它 在 编译 时 调 有 
所 示 的 代码 段 包含 了 下 列 VAR 语句 























特殊 类 型 的 运算 符 ， 


全 是 标量 还 是 非 标量 ) 有 联系 的 是 必须 
整 性 ， 
性 ; 


(a) 


直 都 是 通过 调用 该 运算 符 来 返回 
意 ， 标 识 符 是 选择 器 调用 的 一 种 特殊 情况 )。 


个 标识 符 来 表示 类 型 了 的 任意 值 。 详 细 


ara 


外 


EY 








一 次 阅读 时 如 果 不 理 
每 次 调用 该 运算 符 都 
(更 确切 
因此 ， 
解释 请 参照 






































解释 。 这 是 在 本 书 
E 侈 开 话 题解 释 一 下 这 



































它 的 特殊 是 因为 (a) 它 
日 ， 而 不 是 在 运行 时 调用 。 例 如 























这 个 语句 定义 了 一 个 变量 A， 它 的 值 是 一 个 一 维 数组 (通过 A[1], A[2], .…, A[N] 


的 形式 引用 )， 数 组 9 
就 被 看 作 是 对 ARRAY 类 型 产生 器 的 调 


类 





的 数组 








产生 标量 类 型 )。 玫 








每 个 元 素 都 是 整数 。 忆 





























Pa 


晶 




















确切 地 说 ， 类 型 产生 器 不 是 一 个 类 型 。 


再 回 





到 关系 模 





Fr 
型 ， 


生 器 ， 这 个 类 型 产生 器 允许 
(采用 Tutorial D syntax 语法 ): 





R 





ELAT 





RELAIT 


TION { SNO CHAR ， 


TION { PNO CHAR ， 




















SNAME CHAR 


PNAME CHAR 


生 的 





E 类 型 产生 器 和 


这 里 我 们 最 感 兴趣 的 类 型 产 4 
] 户 说 明 单 个 的 、 所 希望 的 关系 类 型 。 


EE 














STATUS INTEGER 


COLOR CHAR 


了 


pg 么 表达 式 ARRAY [1..N] OF INTEGER 
]， 它 返回 一 个 特定 的 数组 
型 就 是 一 个 被 产生 的 类 型 ( 它 产 
此 ， 请 注意 如 


类 型 。 


这 个 特定 


个 非 标量 类 型 ， 虽 然 有 时 也 可 能 
1 类 型 本 身 之 间 是 有 迪 辑 差异 的 ， 更 








E 器 当然 是 RELATION 类 型 产 


下 面 举 几 个 例子 





7/ CITY CHAR } 


94 


RELATION { SNO CHAR ， 
当然 ， 
。 换 句 话 





时 ( 








系 组 成 一 


言 与 给 
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WEIGHT RATIONAL 


CITY CHAR } 


了 


PNO CHAR , QTY INTEGER } 
这 些 类 型 分 别 是 关系 变量 S、P 和 SP 的 
说 ，RELATION 类 型 产生 器 的 一 个 重要 作用 就 
[在 Tutorial D 中 的 VAR 语句) 去 说 明 所 定义 关系 变量 的 类 型 (事实 
EE 要 的 用 途 )。 


也 是 我 们 正在 使 用 的 例 
是 在 定义 一 些 关 系 变量 


是 些 
FEF， 也 




















关系 值 属性 : 这 一 点 已 经 超出 了 本 书 的 范围 ,我 只 是 想 作为 过 渡 来 提 一 下 。 我 们 知道 : 
(a) 属性 是 有 类 型 的 ; (b ) 关系 类 型 也 是 类 型 。 所 以 了 解 一 下 关系 能 够 具有 来 自 关系 类 型 
的 属性 也 是 不 足 为 奇 的 (例如 ， 关 系 值 属 性 ， 即 属性 的 值 也 是 关系 !)。 因 而 ，RELATION 
类 型 产生 器 的 另 一 个 作用 是 说 明 属性 的 类 型 ， 这 些 属 性 的 标题 与 关系 标题 一 致 。 详 细 讨 论 
参见 SOL and Relational Theory. 





组 命题 


的 





Sr 


I Eo 





命题 





这 样 的 命题 满足 : 〈a) 由 一 





至 于 商业 中 特定 关系 的 解释 ， 也 是 在 给 定 的 上 下 文 环境 中 , 给 定 类 型 的 特定 关 


储 公 


组 实例 化 的 断言 组 成 ， 这 组 断 





p 愉 





be 














人 











关系 变 














关系 的 标题 一 致 ; (b) 由 关系 中 的 
真 的 。 如 果 讨 论 的 上 下 文 环境 为 一 些 关 系 变 


三 


县 








《 即 如 





量 的 当前 值 )， 那 么 讨论 的 这 个 断言 就 是 那个 关系 变 


个 元 组 来 表示 ; 〈c) 这 个 命题 假设 为 








果 我 们 讨论 的 关系 恰好 是 这 些 











三 





的 断言 。 


屋 





而 且 ， 关 系 变量 和 关系 的 解释 要 与 Tpe Closed World Assumption 或 CWA 一 臻 
(参见 第 6 章 ) ”。 






































































































































最 后 ， 让 RT 代表 某 种 关系 类 型 。 那 么 ， 与 RT 有 关 的 ， 有 一 个 具有 某 些 属性 的 
选择 器 运算 符 〈 当 然 ， 这 里 尤 指 关 系 选 择 器 (relation selector)， 即 〈a) 每 次 调用 该 
运算 符 都 返回 一 个 类 型 为 RT 的 关系 ;，(b) 类 型 RT 的 每 个 关系 都 是 在 调用 该 运算 符 
时 返回 的 (更 明确 地 说 ， 通 过 调用 关系 标识 符 ， 参 见 第 3 章 )。 下 面 给 出 几 组 例子 : 

RELATION { TUPLE { SNO 'S1' , PNO 'Pl1' , QTY 300 } ， 

TUPLE {SNO: SD "PNO Ot P6! “i OTY .350 } | 
RELATION { TUPLE { SNO SX , PNO PX , QTY OX } } 
每 个 表达 式 都 返回 一 个 类 型 为 RELATION {SNO CHAR, PNO CHAR, QTY 




















INTEGER} 的 关系 , 这 个 值 可 以 赋 给 关系 变量 SP。 第 


关系 ,实际 











的 属 怕 





和 





上 是 一 个 关系 标识 符 。 第 二 


事实 上 ， 我 间接 地 提 到 过 这 个 可 能 性 。 


























个 表达 式 表 示 了 2 个 元 组 的 











个 表达 式 只 是 








着 玉 


当 我 用 








E 前 面部 和 











就 不 能 依据 与 态 


同村 








lL 的 关系 类 型 来 直 





接 或 间接 定义 。 


























中 提 到 ， 如 果 关 系 x 


表示 了 一 个 元 组 的 关系 ,不 是 











具有 标题 瓦 ， 那 么 > 中 





第 6 章 定义 的 CWA 是 对 





| 关系 变量 的 引 j 














[关系 的 引 














， 不 是 对 


关系 〈 例 如， 查询 结果 )。 





， 但 是 我 希望 的 是 它 能 自然 地 扩充 到 





7.4 关系 变量 95 





标识 符 。 实 际 上 ， 选 择 器 调用 就 是 一 个 标识 符 ， 当 且 仅 当 它 所 有 的 变量 表达 式 都 是 
标识 符 时 。 
最 后 ， 因 为 等 价 比 较 运算 符 “=” 可 以 用 在 与 任何 类 型 的 联接 运算 中 ， 尤 其 是 
常用 在 与 关系 类 型 的 联接 运算 中 ， 所 以 关系 包含 运算 符 “S” 也 可 以 使 用 。 如 果 关 
系 r1 和 x2 具有 同 种 类 型 ， 那么 x] 包含 在 r2 中 ， 当 上 且 仅 当 rl 是 2 的 子 集 时 。 


7.4 关系 变量 


模型 的 第 3 个 部 分 是 “定义 关系 变量 的 工具 ， 这 些 关 系 变量 的 类 型 是 由 关系 类 
型 产生 器 确定 的 ” 从 逻辑 上 来 说 ， 它 遵守 前 面 的 规则 。 也 就 是 说 ，RELATION 类 
型 产生 器 的 主要 作用 是 〈 就 像 前 面 那个 部 分 说 明 的 ) 在 定义 关系 变量 时 用 来 说 明 关 
系 变量 的 类 型 。 关 系 变量 只 允许 在 关系 数据 库 中 使 用 ， 其 他 类 型 的 变量 ， 如 标量 变 
量 或 元 组 变量 都 不 允许 使 用 。 相 反 , 在 访问 数据 库 的 程序 中 , 它们 是 可 以 使 用 的 )。 
数据 库 中 只 包含 关系 变量 的 说 法 是 由 Codd 最 早 在 The eonaoop ee 去 








































































































































































































































































































书 中 正式 提 到 的 。 然 而 ， 我 认为 他 自己 也 没有 规范 使 用 。 相 反 ， 他 经 常 采用 如 下 方 
式 来 说 明 这 个 原理 : 
在 任何 给 定 的 时 间 ， 数 据 库 中 的 整个 信息 内 容 用 唯一 的 方式 来 表示 ， 即 在 关系 


中 元 组 的 属性 中 来 说 明 具体 的 数值 。 

这 个 原理 是 我 在 第 1 章 对 关系 系统 进行 简化 说 明 的 一 个 重要 依据 。 实 际 上 , 我 
听 说 Codd 曾 经 在 很 多 场合 把 它 作 为 关系 模型 的 一 条 基本 原理 。 因 此 对 该 原理 的 任 
何 破坏 都 会 造成 严重 的 后 果 “。 为 什么 这 个 原理 如 此 重要 呢 ? 答案 与 我 在 第 6 章 给 
出 的 结论 有 密切 关系 , 即 在 逻辑 层面 上 , 无 论 表示 什么 样 的 数据 , 关系 都 是 必须 的 ， 
而 且 具 有 表示 数据 的 能 力 。 换 句 话 说， 关系 模型 为 我 们 提供 了 一 切 我 们 需要 的 事 
情 ， 它 也 没有 提供 我 们 不 需要 的 任何 事情 。 
对 此 问题 我 想 多 解释 几 句 。 首 先 ， 如果 及 种 不 同 的 表示 数据 的 方法 ， 那 么 我 
们 就 需要 个 不 同 的 运算 符 集 合 。( 第 2 章 时 我 曾 提 到 过 这 一 点 。) 例如 ， 如 果 既 有 
数组 又 有 关系 ,那么 就 需要 有 数组 运算 符 以 及 关系 运算 符 。 我 们 也 要 选择 数据 采用 
关系 还 是 数组 来 表示 ， 而 在 进行 选择 时 ,没有 相关 的 指南 可 以 帮助 我 们 。 所以， 如 
果 n 大 于 1， 我 们 就 需要 实现 多 个 运算 符 ， 并 对 它们 进行 归档 、 学 习 、 了 解 、 记 住 
及 使 用 。 但 是 这 些 额 外 的 运算 符 增加 了 复杂 度 ， 而 不 是 加 强 了 力量 。 如 果 n 大 于 1 
时 它 没 有 什么 可 做 的 ， 如 果 n 等 于 1 时 也 没有 什么 不 能 做 的 (当然 在 关系 模型 中 
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1 这 里 没有 说 明 对 象 数据 库 、XML 数据 库 及 更 通用 的 非 关系 数据 库 都 会 破坏 它 。 不 幸 的 是 ，SQL 数 
车 也 是 如 此 (参见 本 书 的 第 三 部 分 )， 除 非 遵循 一 个 合适 的 规则 。 
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n 肯定 等 于 1)。 而 且 ， 关系 模型 不 仅 为 我 们 提供 了 唯一 的 表示 数据 的 方法 ,而 且 这 
种 方法 相当 简单 。 

对 数据 库 变 量 的 解释 : 就 像 Hugh Darwen 和 我 在 我 们 的 著作 Databases, TDpes, and the 
Relational Model: The Third Manifesto (2007 年 ， 第 三 版 ) 中 证 明 的 : 数据 库 不 只 是 关系 变 
量 的 容器 ， 即 使 我 们 通常 这 样 讨论 它 ， 相 反 ， 它 是 一 个 独立 存在 的 变量 ! 别 忘 了 ， 它 是 可 以 
被 修改 的 ， 因 此 ， 根 据 定义 它 是 一 个 变量 。 换 多 话说 ， 从 逻辑 上 来 讲 ， 作 为 一 个 整体 ， 数 据 
库 本 身 就 是 一 个 变量 ， 称 作 数 据 库 变量 ( 记 为 dbvar )。 换 个 角度 ， 数 据 库 关系 变量 真 的 是 一 
种 假象 (即使 这 个 假象 在 实际 情况 中 相当 有 用 ， 就 像 Einstein 曾经 说 过 的 ( 虽然 在 不 同 的 环境 
中 )， 叭 一 的 真 变量 就 是 数据 库 本 身 ， 在 它 的 全 部 。 这 个 概念 在 我 的 另 一 本 书 中 有 深度 解释 ， 即 
View Updating and Relational Theory: Solving the View Update Problem (2013 年 ，O’Reilly 出 版 )。 

顺便 说 一 下 ， 我 不 知道 你 是 否 注意 到 了 ， 到 目前 为 止 我 还 没有 确切 地 给 出 术语 数据 库 
的 明确 定义 。 而 且 ， 现 在 也 不 会 给 出 ( 这 个 问题 比 它 看 起 来 要 复杂 得 多 )。 然 而 ， 为 了 达到 
实用 的 目的 ， 我 上 面 的 这 些 做 法 也 许 是 最 简单 的 ， 即 数据 库 就 是 关系 变量 的 容器 (从 关系 
模型 的 角度 来 看 )。 要 提醒 的 是 ， 如 果 给 定 每 个 关系 变量 就 是 断言 ， 也 给 定 这 些 关系 变量 的 
每 个 元 组 ， 而 这 些 关 系 变量 与 相应 断言 的 真实 例 化 值 相 一 致 ， 那 么 就 可 以 在 任何 时 候 把 数 
据 库 看 作 是 表示 这 些 真 命题 的 集合 ( 就 像 第 6 章 看 到 的 )。 


7.5 关系 赋值 


关系 模型 的 第 4 部 分 是 “关系 赋值 运算 符 ， 可 以 把 关系 值 赋 给 确定 的 关系 变 
十 >。 它 要 遵守 前 面 第 2 条 和 第 3 条 规则 。 这 一 点 很 简单 :赋值 运算 符 “;， =” 与 等 
比较 运算 符 “=” 相 似 ， 它 可 以 应 用 在 任何 类 型 中 (因为 没有 它 ， 我 们 就 没有 办 
失 把 值 赋 给 特定 类 型 的 变量 )， 当 然 天 系 类 型 也 不 例外 。 运 算 符 INSERT、DELETE 
及 UPDATE (也 包括 D INSERT 和 I DELETE) 也 允许 使 用 ， 而 且 是 非常 有 用 的 ， 
有 旦 严格 来 说 它们 只 是 一 种 简化 ， 而 且 ， 如 果 支 持 关 系 赋 值 ，(a) 必须 要 特别 支持 多 
重 关系 赋值 〈 参 见 第 6 章 6.1 节 “ 数 据 库 约束 ”部 分 后 面 的 注释 )，(b〉 必 须 禁 上 上 使 
赋值 规则 (The Assignment Principle) 和 黄金 规则 (The Golden Rule)， 具 体 如 下 : 

口 ”赋值 规则 (参见 第 1 章 ) 说 明 ， 把 值 y 赋 值 变量 二 后， 比较 v= 严 就 可 以 
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口 ”黄金 规则 (参见 第 6 章 〉 说 明 ， 所 有 的 完整 性 约束 必须 满足 语句 边界 值 。 


7.6 关系 运算 符 
关系 模型 的 第 5 部 分 是 “从 关系 上 说 ,是 完整 的 ， 但 是 开放 的 通用 关系 运算 符 

















二 入 人 A 
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的 闭 集 ， 这 些 运算 符 可 以 从 其 他 关系 值 产 生 新 的 关系 值 ”。 当然， 运算 符 的 集合 就 





是 关系 代数 ， 或 者 与 代数 逻辑 上 等 价 的 事物 。 就 像 在 第 4 章 讲 到 的 ， 运 算 符 是 通用 
的 > 






























































实际 上 从 某 种 意义 上 来 说 它 可 以 应 用 到 任何 可 能 的 关系 中 《〈 例 如， 我 们 不 需要 


























一 个 联接 运算 符 去 联接 供应 商 和 供应 关系 , 再 定义 一 个 联接 运算 符 去 联接 部 门 和 雇 










































































员 关 系 )。 确 切 地 说 ， 并 没有 明确 说 明 必 须 支 持 哪 一 个 运算 符 ， 但 至 少 需要 它们 才 
能 获得 关系 完整 性 这 一 特征 。 




















关系 完整 性 是 衡量 某 种 语言 表达 能 力 的 基本 标准 。 不 严格 地 说 ,如 果 某 种 语言 


























从 关系 上 来 说 是 完整 的 ， 则 (ay) 可 以 用 此 种 语言 表示 “所 有 可 能 的 查询 ”(b)》 而 





且 ， 
用 分 支 或 循环 的 话 也 可 以 规范 实现 '， 更 确切 一 点 地 说 ， 如 果菜 种 语言 L 是 完整 的 ， 
那么 采用 Z 表 示 的 表达 式 就 允许 依据 关系 代数 表达 式 来 定义 关系 。 因 而 语言 Z 至 少 




















任何 查询 都 可 以 正规 地 表示 为 一 个 表达 式 。 因 此 ， 任 何 复杂 的 查询 如 果 没 有 条 






























































要 与 关系 代数 一 样 强大 。 因 此 基本 的 关系 完整 性 就 是 允许 用 户 直接 访问 数据 库 〈 至 
少 从 理论 上 来 说 是 这 样 的 ， 虽 然 实 际 上 可 能 并 不 是 这 样 )， 而 不 用 通过 IT 部 门 的 其 





他 途径 。 


只 能 表示 规范 化 的 查询 。 但 实际 不 是 这 样 的 ， 相 反 ， 它 可 以 表示 任何 规范 的 关系 表 
达 式 。 这 些 表 达 式 反 过 来 可 以 发 挥 很 多 作用 ， 包 括 查询 ， 但 不 仅仅 局 限于 查询 。 下 
面 再 强调 儿 点 重要 的 事情 : 












































关系 运算 的 解释 : 实际 上 ， 第 一 次 给 出 关系 完整 性 的 定义 是 在 Codd 的 一 篇 论文 中 ( 参 
见 附 录 也)，Codd 说 ， 一 个 语言 是 关系 上 完整 的 ， 当 且 仅 当 它 至 少 与 关系 运算 一 样 强大 ， 
而 不 是 关系 代数 。 关 系 运算 是 关系 代数 的 一 种 替代 品 。 它 是 基于 谓词 远 辑 的 另 一 种 规范 表 
示 ， 而 不 是 基于 集合 理论 的 ， 因 此 (a) 它 可 以 用 来 表示 规范 的 查询 、 约 束 等 等 ; (b ) 它 的 
表示 方式 与 代数 是 等 价 的 (表示 方式 等 价 的 意思 是 ， 对 于 代数 的 每 一 种 表示 方式 ， 在 逻辑 
表示 上 与 运算 是 一 致 的 ， 对 于 运算 的 每 一 种 表示 方式 ， 在 逻辑 上 与 代数 也 是 等 价 的 )。 

对 于 关系 运算 这 里 不 想 讲 的 太 详细 。 选 择 代数 和 运算 只 是 个 人 喜好 的 问题 ， 以 上 讲 的 
这 些 就 足够 了 。 有 些 人 喜欢 代数 ， 而 有 些 人 喜欢 运算 。( 有 些 问题 采用 关系 代数 表示 更 容易 
理解 ， 而 有 些 问题 采用 关系 运算 会 更 容易 理解 ， 二 者 之 间 没 有 好 与 不 好 之 分 。 再 重复 一 下 ， 
它们 是 等 价 的 。) 如 果 你 感 兴趣 ， 想 了 解 更 多 的 内 容 ， 可 以 参见 附录 D。 
现在 ， 对 于 代数 的 目的 似乎 造成 了 更 大 范围 的 误解 。 特 别 是 许多 人 似乎 认为 它 






















































































口 “ 定 义 一 个 元 组 集合 来 实现 插入 、 删 除 , 或 者 对 关系 变量 进行 修改 (或 者 说 ， 
定义 一 个 元 组 集合 ， 并 把 它 赋 值 给 某 个 关系 变量 ; 

定义 完整 性 约束 (虽然 这 里 讨论 的 关系 表达 式 只 是 布尔 表达 式 的 一 个 子 表 
达 式 ， 而 且 在 Tutorial D 中 ， 一 个 IS_EMPTY 调用 不 是 不 可 以 变化 的 ); 










































































注意 : 前 面 的 章节 中 没有 一 个 例子 涉及 分 支 或 循环 。 
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口 “ 定 义 安 全 性 约束 《看 下 面 的 进一步 讨论 ); 
口 “ 定 义 视 图 《同样 看 下 面 的 进一步 讨论 ); 
口 ”作为 对 优化 和 数据 库 设 计 领 域 进一步 研究 的 基础 : 


7.6.1 安全 性 


就 像 在 第 1 章 看 到 的 ， 安 全 性 约束 《或 者 安全 性 控制 ) 用 来 保证 用 户 请 求 的 合 
法 性 。 换 名 话说 ， 用 户 请 求 被 限制 为 〈a) 允许 执行 用 户 请 求 的 那些 操作 ; 〈b) 用 户 
只 允许 访问 他 们 被 授权 访问 的 数据 库 的 部 分 。 实 际 上 , 说 明 哪 些 情况 是 允许 要 比 说 
明 哪 些 情况 是 不 允许 的 要 更 容易 些 。 因 此 ， 一 般 文 持 定 义 安 全 性 语言 ， 即 不 是 安全 
性 约束 ， 而 是 授权 ， 这 从 效果 来 看 与 安全 性 约束 是 相反 的 〈 即 授权 某 些 事情 ， 而 不 
是 限制 某 些 事情 )。 下 面 给 出 几 个 例子 加 以 说 明 “: 


AUTHORITY SX1 







































































































































































GRANT RETRIEVE { SNO , SNAME } , DELETE 
ON S 

WHERE CITY = 'London' 

TO Jim , Fred ，Mary }; 





AUTHORITY SX2 





GRANT RETRIEVE , UPDATE { STATUS , CITY } 
ON S 
TO Dan ， Misha :， 











对 于 安全 性 的 扩展 讨论 (例如 , 授权 以 外 的 事情 ) 可 以 在 我 的 著作 4n Introduction to 
Database Systems (第 8 版 ，Addison-Wesley，2004 年 出 版 ) 中 找到 。 























7.6.2 视图 
考虑 下 面 的 查询 (“获得 伦敦 供应 商 的 信息 ”): 
S WHERE CITY = 'London'; 





假设 特定 的 查询 要 反复 多 次 地 重复 使 用 , 那么 我 们 就 可 以 通过 定义 一 个 虚拟 关 
系 变量 或 视图 来 简化 一 下 。 









































1 请 注意 ， 优 化 和 数据 库 设 计 自身 都 具有 非常 丰富 的 标识 。 但 是 在 两 种 情况 下 ， 为 研究 它们 所 付出 的 

许多 努力 将 不 是 很 简单 地 具有 茶 种 可 能 性 ， 除 了 关系 模型 中 提供 的 稳固 的 逻辑 框架 外 (进一步 的 讨 

论 请 参见 第 9 前 。 

2 包含 了 一 些 非 安全 性 特征 ， 但 是 这 些 例子 被 看 作 是 语言 的 一 种 表示 方式 。SQL 包含 了 安全 性 特征 
但 是 这 些 说 明 远 远 超出 了 本 书 的 范畴 。 
















































































和 馈 全 
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VAR LS VIRTUAL ( S WHERE CITY = 'London' ), 
现在 整个 查询 就 可 以 表示 成 如 下 的 简化 形式 : 
LS 

















或 者 如 果 我 们 还 可 以 在 原始 的 查询 基础 上 再 定义 一 个 稍微 复杂 的 变量 ,， 即 “ 查 
询 状态 值 为 10 的 伦敦 供应 商 的 信息 ”: 

LS WHERE STATUS = 10 

我 们 详细 分 析 一 下 这 个 例子 。 其 核心 思想 就 是 当 我 们 定义 一 个 视图 时 , DBMS 
通过 把 它 存在 一 个 称 为 “目录 (catalog)” 的 地 方 来 记 住 它 的 定义 ， 那 么 ， 当 它 处 
理 查 询 时 ，DBMS 就 会 在 目录 中 查找 视图 的 定义 ， 然 后 用 这 个 定义 替代 这 个 查询 中 
引用 视图 的 地 方 ， 即 : 


( S WHERE CITY = 'London' ) WHERE STATUS = 10 


这 个 表达 式 的 判断 方式 与 关系 表达 式 的 判断 方式 完全 相同 。 
因为 这 个 简单 的 例子 足以 说 明 视 图 机 制 可 以 允许 用 户 执行 想 要 进行 的 查询 , 就 
好 像 视图 是 一 个 常规 的 关系 变量 ,， 因 而， 对 于 用 户 来 说 在 某 些 方面 使 用 起 来 就 要 人 简 
化 得 多 这 与 高 级 语言 中 的 宏 变 量 非常 相似 )。 再 强调 下 面 几 点 。 
口 ”第 一 ， 因 为 关系 的 闭 包 特 性 要 求 视图 必须 精确 地 处 理 查 询 ! 这 是 因为 它 是 
那个 属性 的 轴 辑 结果 ， 如 果 (a) 关系 变量 引用 R 允许 出 现在 某 个 关系 表 
达 式 rx 的 某 个 地 方 ; (b) 引用 R 是 被 赋予 类 型 RT 的 一 个 关系 变量 ， 那 么 
判断 与 RT 具有 相同 类 型 关系 的 表达 式 就 被 允许 出 现 rx 中 ， 而 rx 出 现在 
关系 变量 引用 R 的 某 个 地 方 。 因 而 ， 作 为 这 个 规则 的 一 个 特定 实例 ， 我 们 
可 以 通过 视图 定义 表达 式 (例如 : S WHERE CITY = 'London” )， 在 表达 式 
LS WHERE STATUS = 10 替代 视图 引用 LS。 
口 “ 第 二 , 回顾 第 1 章 的 图 1.2 (数据 库 系统 架构 )。 可 以 在 该 架构 中 增加 一 层 ， 
如 图 7.1 所 示 。 
本 顾 我 在 第 1 章 所 说 的 逻辑 数据 库 与 物理 数据 库 的 分 离 ， 目 的 是 要 允许 用 户 实 
现 数据 独立 性 。 但 现在 我 不 想 更 确切 地 解释 这 个 事情 。 特 别 是 ， 这 种 分 离 〈 即 逻辑 
数据 库 与 物理 数据 库 的 分 离 ) 允许 我 们 实现 数据 的 物理 独立 性 ， 这 就 意味 着 我 们 可 
以 改变 数据 的 存储 方式 ， 对 于 用 户 来 说 访问 时 不 需要 对 访问 方式 做 任何 的 改变 。 通 
过 定义 视图 实现 视图 与 关系 变量 的 分 离 , 也 允许 我 们 实现 数据 的 逻辑 独立 性 ， 即 我 










































































































































































































































































































































































































































































1 对 于 给 定 的 数据 库 ， 目 录 就 是 一 组 定义 的 系统 关系 变量 集合 ， 也 被 保存 在 数据 库 中 ， 用 来 描述 所 要 
讨论 的 数据 库 。 描 述 信息 〈 有 时 也 称 为 元 数据 ) 包括 给 定 关系 变量 的 属性 和 码 的 详细 信息 ， 以 及 完 
整 性 约束 和 授权 的 详细 信息 。 
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们 可 以 改变 数据 的 逻辑 存储 方式 ， 对 于 用 户 来 说 访问 时 不 需要 对 访问 方式 做 任何 的 
改变 。 


virtual relvars (views) 


suppliers, parts, and shipments 
(“logical DB”) 


DB management system (DBMS) 


} 


data as physically stored 
(physical DB”) 











图 7.1 带 有 视图 的 数据 库 系 统 架 构 





























对 于 视图 的 进一步 讨论 可 以 参见 SOL and Relational Theory， 或 者 我 的 另外 一 
本 书 ， 即 View Updating and Relational Theory:How to Update Views (2003 年 ，O’Relly 
出 版 )。 





7.7 结论 


本 书 的 第 一 部 分 到 此 结束 。 该 部 分 详细 介绍 了 关系 模型 本 身 , 以 及 对 于 DBMS 
的 重要 性 。 对 比 而 言 ， 在 第 三 部 分 ， 我 们 将 看 到 标准 的 “关系 型 ”语言 SQL， 专 
门 描述 了 (或 许 我 应 该 说 在 某 种 程度 上 ) 如 何 使 用 该 语言 来 实现 我 们 所 讨论 的 各 种 
各 样 的 关系 特征 。 然而， 在 此 之 前 ,我们 需要 检验 一 些 特定 的 话题 (例如 事务 和 数 
据 库 设计 )， 就 像 我 在 前 言 中 提 到 的 那样 ，(a) 为 了 评价 数据 库 的 全 部 功能 ， 你 胡 
实 需要 对 数据 库 有 一 个 基本 的 了 解 ;(b) 但 是 不 需要 对 关系 模型 本 身 有 过 多 的 了 解 
(虽然 它们 都 是 建立 模型 的 基础 )。 这 就 是 下 面 将 要 介绍 的 第 二 部 分 的 目的 。 































































































































































































第 二 部 分 


事务 和 数据 库 设 计 


为 时 光 ， 你 也 可 以 失而复得 。 
一 一 Geoffrey Chaucer: Troilus and Criseyde (1385) 
































有 务 的 概念 只 是 与 大 多 数 用 户 有 关 ， 但 这 不 完全 是 正确 的 。 如 果 你 是 一 些 编写 
数据 库 应 用 程序 的 程序 员 , 那么 你 肯定 需要 知道 事务 的 确实 含义 , 才能 帮助 你 去 编 
写 代码 , 但 是 你 也 不 必 知 道 得 过 于 详细 。 如 果 你 是 一 个 交互 的 用 户 ,你 可 能 根本 不 
需要 知道 那么 多 。 男 一 方面 (前 面 我 或 多 或 少 地 提 到 过 )， 如 果 你 想 要 对 数据 库 技 
术 的 全 貌 有 一 个 概括 的 了 解 ， 那 就 必须 对 事务 管理 的 细节 有 一 个 基本 的 认识 。 

前 面 我 也 曾经 说 过 ， 事 务 管理 本 身 并 不 是 真正 的 关系 型 的 话题 。 然 而 ， 有 趣 的 
是 在 特定 的 关系 型 环境 中 ， 都 要 对 事务 管理 进行 基础 研究 。 也 就 是 说 ， 提 出 这 个 
概念 是 为 了 建立 一 个 健全 的 科学 研究 基础 。 


8.1 什么 是 事务 
务 就 是 程序 的 一 次 执行 过 程 ， 或 者 是 程序 的 一 部 分 , 它 由 一 组 逻辑 工作 单元 


组 成 。 以 BEGIN TRANSACTION 语句 开头 ， 表 示 事 务 开 始 ， 以 COMMIT 语句 或 
ROLLBACK 语句 结尾 ， 表 示 事 务 执行 结束 ， 有 具体 如 下 : 
BEGIN TRANSACTION 语句 必须 存在 ， 显 式 说 明 ; 


COMMIT 表示 事务 成 功 结束 ， 显 式 说 明 ; 
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1 参见 由 K.P. Eswaran、J. N.Gray、R. A. Lorie 和 I.L. Traiger (1976 年 11 月 举办 的 CACM 19 会 议 ， 
第 11 篇 文章 ) 撰写 的 基础 文章 The Notions of Consistency and Predicate Locks in a Data Base System,， 
























































以 及 Jim Gray and Andreas Reuter 的 标准 文章 Transaction Processing: Concepts and Techniques (1993 
年 ，Morgan Kaufmann 出 版 )。 
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ROLLBACK 表示 事务 执行 失败 ， 事 务 回 滚 ， 通 常 隐 式 说 明 。 
因而 ， 任 意 给 定 的 一 个 程序 都 包含 一 个 依次 执行 的 事务 序列 ， (序列 中 事务 的 
数量 也 可 以 为 1), 如 图 8.1 所 示 。 
tie -上 上“ 


begin transaction 
































图 8.1 程序 的 事务 执行 序列 





8.2 恢复 


数据 库 中 所 有 的 修改 操作 都 可 以 通过 执行 事务 来 实现 ， 理 解 这 一 点 非常 重要 。 
这 是 因为 事务 不 仅仅 是 一 般 工 作 单元 ， 它 们 也 是 一 个 恢复 〈recovery) 单元 。 我 来 
解释 一 下 ,通常 以 某 类 银行 业务 作为 一 个 标准 例子 , 下面 的 例子 实现 了 从 一 个 账户 
转账 100 美元 到 另 一 个 账户 ， 这 是 事务 的 伪 代 码 : 


BEGIN TRANSACTION ; 































































































UPDATE account 123 : { BALANCE := BALANCE - 100 },; 
IF error THEN ROLLBACK ; 
UPDATE account 321 : { BALANCE := BALANCE + 100 },; 
IE error THEN ROLLBACK ; 

COMMIT ; 





可 以 看 到 ,这 是 一 个 原子 操作 ( 即 从 账户 123 转账 100 美元 到 另 一 个 账户 321)， 
事实 上 ， 它 涉及 对 数据 库 进行 两 次 单独 的 修改 “。 而 且 ， 在 两 次 修改 操作 之 间 ， 数 
据 库 实际 上 是 处 于 不 正确 的 状态 ， 因 此 这 时 它 就 不 能 反映 真实 世界 中 的 真正 状态 。 
显然 ， 在 真实 世界 中 ， 两 个 账户 的 转账 业务 不 能 反映 该 账户 中 的 总 额 , 但 是 在 这 个 
例子 中 ，100 美元 只 是 在 两 次 修改 之 间 和 暂时 丢失 了 。 因 而 ， 一 个 事务 中 的 逻辑 工作 





































































































1 男 一 种 说 法 为 :如果 当前 正在 执行 一 个 事务 ， 则 不 允许 使 用 BEGIN TRANSCTION。 

2 由 于 可 以 使 用 多 重 赋值 ， 实 际 上 在 Tutorial D 中 只 是 一 次 修改 〈 参 见 第 6 章 )。 为 了 当前 讨论 方便 ， 
要 必须 假设 这 个 运算 符 是 不 可 用 的 《或 者 是 不 能 使 用 的 )。 实 际 上 ， 有 必要 显 式 声 明 一 下 ， 当 在 事 
务 中 使 用 基本 理论 时 ， 不 可 能 考虑 多 重 赋值 。 






























































































































































单元 不 能 只 单单 涉及 

















这 个 序列 的 目的 是 把 数据 库 从 


























考虑 任何 中 间 点 的 正月 








性 。 














当 











ED 











主意 : 现在 进一步 明确 一 点 ,该 例子 中 数据 库 在 














次 修改 。 相 反 ， 这 个 逻辑 单元 通常 要 涉及 多 个 操作 的 序列 ， 
个 正确 的 状态 转换 到 男 一 


个 正确 的 状态 , 而 且 不 必 









































到 过 ， 正 确 














致 性 。 





而 不 用 考虑 任何 中 间 点 的 正月 


























部 分 我 还 要 继续 讨论 这 个 问题 。 








显然 ， 在 该 例 9 





会 把 数据 库 置 于 不 正确 


























能 成 功 。 但 不 垃 世 





可 能 出 错 的 时 





| 候 吕 
生 运 算 溢出 。 但 是 1 








执行 第 一 次 修改 而 不 执行 第 二 次 





是 ， 提 供 这 种 保证 几乎 是 不 可 能 的 。 因 
b 错 。 例如， 在 两 次 修改 之 间 会 发 生 系统 冲突 ， 可 能 在 第 二 次 修改 时 发 














修改 ， 那 么 在 事务 到 达 





E 确 的 事务 处 
预 

















性， 这 种 说 法 更 准 胡 


致 性 , 但 是 反 过 来 是 不 一 定 的 ; 不 正确 
因而 , 事务 的 目的 是 把 数据 库 从 当前 的 一 致 性 状态 转换 到 另 一 种 一 致 性 状态 ， 
在 8.2.2 节 “ACID 特 性 ” 











些 。 


























丙 次 修改 之 间 的 状态 肯定 是 不 
的 ， 是 不 一 致 的 。 但 它 不 会 破坏 任何 已 知 的 完整 性 约束 1。 我 在 第 6 章 曾 经 提 


























朋 


性 并 不 意味 着 不 一 




















网 改 ， 这 是 不 允许 发 生 的 ， 因 为 这 
的 状态 。 理 想 的 情况 是 我 们 想 要 一 个 严格 的 保证 ， 即 两 次 修改 都 
为 操作 就 会 出 错 ， 而 且 会 在 最 














理会 提供 次 级 最 好 的 保证 。4 


























a 


证 这 些 失败 的 事务 会 


日 


























检 涡 


的 


被 撤销 《〈 就 好 像 事务 


滚 “〈 例 如 ，undone 操作 )。 

















民 本 没 执 行 一 样 )。 在 这 种 


成 功 结束 : COMMIT 可 以 
据 库 中 )。 
不 成 功 结束 : ROLLBACK 可 
此 就 会 撤销 事务 的 修改 )， 然 后 终止 事务 。 
隐 式 ROLLBACK: 美元 转账 例子 
| 一 个 错误 条 件 ， 就 会 迫 
们 不 能 假设 ， 也 不 能 做 任何 
显 式 检测 。 因 此 ， 系 统 迫 使 





隐 


行 
或 














显 式 的 ROLLBACK。 而 上 且 
错 ， 也 会 失败 )， 那 么 系统 就 会 重 局 ， 








竺 别 是 ， 如 果 事 务 执行 一 些 














期 的 结束 点 前 发 生 失 败 的 话 ， 事 务 管理 
因而 ， 事 务 要 2 
情况 下 ， 从 外 部 来 看 非 原子 的 操作 序列 
就 可 以 被 看 作 是 原子 的 。COMMIT 和 ROLLBACK 操作 是 实现 这 个 保证 的 关键 。 

采 证 事务 修改 后 正常 提交 《这 些 修 改 被 写 入 数 
































就 会 提供 
全 部 执行 ， 要 么 全 部 











一 些 保证 ， 保 





























一 个 显 





使 执行 

















因 某 种 原 






































首 让 事务 再 习 


以 保证 把 事务 回 深 到 事务 的 

















始 执 行 状态 ( 因 





P 的 代码 包含 了 错误 的 显 式 测试 ， 如 果 
式 的 ROLLBACK。 
段 设 ， 事务 一 直 会 包含 对 所 有 可 
因 没 有 达到 预期 结束 的 失败 事务 执 
式 的 ROLLBACK， 这 里 “预期 的 结束 点 ”含义 是 显 式 的 COMMIT 
L， 如 果 发 生 系统 冲突 〈 这 时 即使 事务 本 身 没 
新 执行 一 次 。 








但 是 显然 我 
能 发 生 的 错误 




















因此 ， 在 这 个 例子 中 ， 如 果 事 务 成 功 执行 了 两 次 修改 ， 就 是 执行 COMMIT， 





把 这 些 修 改写 入 数据 库 。 如 果 任 一 个 修改 发 生 错误 ， 都 会 执行 ROLLBACK， 撤 销 
E 了 一 个 完全 未 预料 到 的 错误 ， 如 系统 ; 





目前 所 做 的 所 有 修改 。 如 果 发 4 





1 而 且 ， 我们 所 写 





的 完整 性 














约束 条 件 会 被 





























' 突 ， 那 么 系 














元 转账 例子 破坏 ， 这 是 没有 


任何 理 








的 (正确 吗 ? )。 
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统 就 被 迫 执 行 ROLLBACK。 
8.2.1 恢复 日 志 
你 可 能 正在 考虑 ,撤销 修改 可 以 实现 吗 ? 基本 的 解决 方案 是 , 系统 会 永久 保存 

















一 个 日 志 《〈 通 常 在 硬盘 上 )， 日 志 中 记录 了 修改 的 详细 信 
































上 县， 特别 记录 每 次 修改 对 


象 之 前 的 值 及 修改 对 象 之 后 的 值 ， 有 时 称 为 修改 前 的 映像 (before-images) 和 修改 














后 的 映像 (afie 


r-images) !。 因 此 ， 如 果 要 撤销 特定 的 修改 ， 

















了 ， 系 统 要 使 




















寺 相 应 的 日 志 记录 把 修改 对 象 恢复 到 初始 值 《也 前 
恢复 到 它 修 改 之 前 的 值 )。 当 然 ， 为 了 完成 此 过 程 














志 就 变 得 非常 重要 





是 说 ， 把 修改 对 象 


， 给 定 修改 的 日 志 记录 必须 在 这 








个 修改 被 实际 写 入 到 数据 库 之 前 记录 到 日 志文 件 中 “。 这 个 协议 被 称 为 事先 写 入 日 


志 规 则 (the wr 








ite ahead log rule)。 


附加 : 当然 ， 这 个 事先 写 入 日 志 规 则 所 提供 的 优点 要 比 你 期 望 得 多 。 更 特殊 的 是 ， 这 
个 规则 需要 实现 (a ) 对 于 给 定 事务 的 所 有 其 他 日 志 都 要 在 该 事务 的 COMMIT 记录 被 物理 
地 写 入 日 志 之 前 ， 被 物理 地 写 入 到 日 志 中 ; (b ) 直到 该 事务 的 COMMIT 记录 被 物理 地 写 入 
到 日 志 中 ，COMMIT 处 理 才 能 完成 。 
遵守 以 上 规则 的 事务 不 仅仅 是 一 个 工作 单元 , 也 是 一 个 恢复 单元 。 下 面 我 们 讨 



















































































每 个 事务 都 具有 





















































其 他 事务 进行 隔离 ， 直 到 该 


论 下 一 个 话题 ， 即 事务 的 ACID 特性 。 
8.2.2 ACID 特性 
ACID 是 缩写 形式 ， 代 表 原 子 性 、 一 至 性、 隔离 性 、 持 久 性 。 
这 4 个 特性 。 
口 ”原子 性 (Atomicity):; 事务 要 么 全 部 执行 ， 要 么 全 都 不 执行 。 
口 ”一致 性 (Consistency): 事务 把 数据 库 从 一 个 一 致 性 的 状态 转换 到 另 一 个 
一 致 性 的 状态 ， 而 不 需要 去 考虑 保持 任何 中 间 点 的 一 致 性 。 
口 ”隔离 性 (Isolation ); 任何 事务 的 修改 都 与 所 有 
事务 被 成 功 提 交 。 
口 ”永久 性 (Durability): 一 旦 事务 被 成 功 提交 ， 所 有 的 修改 会 被 永久 保存 在 
数据 库 中 ， 即 使 后 来 发 生 了 系统 冲突 。 














原子 性 和 持久 性 的 含义 是 事务 分 别 是 一 个 工作 单元 和 一 个 恢复 单元 。 而且 , 一 
致 性 的 含义 是 事务 也 是 完整 性 单元 请 看 下 面 一 段 的 说 明 )， 隔 离 性 的 含义 是 事务 


























1 你 可 以 把 “对 象 




















间 也 被 写 入 到 儿 

















”看 作 是 元 组 。 虽 然 在 实际 情况 中 ,“ 对 象 ”更 可 能 被 认为 是 物理 对 象 ， 比 如 磁盘 页 。 
2 这 里 “被 物理 地 写 入 ”的 含义 是 讨论 的 记录 不 仅仅 被 停留 在 内 存 的 某 个 地 方 ， 而 且 在 之 后 的 某 个 时 


























上 存 ， 起 到 永久 保存 的 作 



































8.3 并 发 性 107 











I 





也 是 一 个 并 发 单元 。 现 在 我 们 已 经 知道 了 原子 性 、 持 久 性 的 实现 方法 , 但 其 他 两 种 





特性 还 需要 进一步 说 明 。 


实际 上 我 不 想 对 一 致 性 解释 太 多 , 而 且 提 出 
假设 了 直到 事务 正常 提交 时 才能 进行 完整 性 约束 检测 ( 即 “ 推 迟 检测 ”)。 同 时 ,在 
标准 的 SQL 和 特定 的 商业 DBMS 中 ， 完 整 性 检测 
检测 的 这 个 事实 从 录 辑 上 来 说 是 不 正确 的 〈 我 在 











这 个 特性 我 是 有 些 犹 驳 的 ,因为 它 









































的 推迟 是 能 真正 实现 的 ， 坚 持 推迟 


























第 6 章 曾 简单 地 提 到 了 ， 详 细 内 容 





可 以 参照 SOL and Relational Theory 一 书 ) :。 就 像 我 们 在 第 6 章 看 到 的 ， 这 是 因为 
关系 模型 需要 立即 检测 所 有 的 约束 条 件 ， 这 就 暗示 了 只 要 涉及 关系 模型 ， 那么 完整 











性 单元 就 不 能 是 事务 ， 只 能 是 语句 。 





























现在 就 剩 下 隔离 性 了 。 这 里 要 利 

















8.3 并 发 性 





到 目前 为 止 ， 本章 大 部 分 的 时 间 都 假设 
务 。 但 是 现在 要 假设 同时 并 发 运行 两 个 或 多 个 














两 个 部 分 详细 地 解释 一 下 隔离 性 。 

















E 给 定 的 时 间 系 统 中 只 运行 了 一 个 事 
事务 ， 那么， 就 像 第 1 章 指出 的 ， 控 














制 是 必须 的 , 这 是 为 了 要 保证 这 些 事 务 相互 之 间 
间 是 相互 独立 的 )。 例 如 ， 考 虑 图 8.2 所 示 的 运行 方案 。 该 图 的 含义 如 下 : 首先 ， 























不 能 干扰 (我 们 通常 要 假设 事务 之 








事务 TXI 修改 对 象 p, 然后 事务 TX2 要 查询 同一 个 对 象 p, 最 后 吾 和 ”7X1 被 回 滚 。 
这 时 事务 7X2 已 经 看 到 ， 它 的 操作 要 依赖 于 一 个 从 没有 发 生 的 修改 。 

















Transaction TX1 








Tran 








saction TX2 





update p 


ROLLBACK 








v 
time 





图 8.2 事务 7X2 依赖 于 一 个 











图 8.3 所 示 的 运行 方案 更 糟糕 , 事务 TXI 和 7X2 同时 检索 同一 个 对 象 p, 接着 寻 
务 TX1 修改 该 对 象 p， 然 后 事务 TX2 也 修改 同一 个 对 象 p， 因 而 Z22 的 修改 被 覆盖 了 


























1 因此 ， 有 意思 的 是 ， 标 识 符 “C” 通 党 了 








四 














] 来 代表 一 致 和 


retrieve p 


未 提交 的 修改 





4 











E， 而 是 代表 正确 性 。 
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《在 此 时 间 点 ，ZX7 的 修改 被 称 为 “丢失 ”) ，。 


Transaction TX1 


Transa 


ction TX2 





retrieve p 


update p 





图 8.3 






































图 8.2 和 图 8.3 发 生 的 情况 说 明了 一 个 事务 
并 行 的 事务 会 产生 一 个 完全 不 正确 的 结果 。 顺 便 说 


retrieve p 


update p 














v 
time 
事务 ZXZ7 的 修改 丢失 

















的 执行 会 受到 另 一 个 事务 的 干扰 ， 
下 ， 如 果 允 许 事务 并 行 执 行 ， 





加 以 适当 的 控制 ， 这 些 图 中 说 明 的 问题 (图 8.2 中 依赖 于 未 提交 的 修改 ， 图 8.3 中 



































的 丢失 修改 ) 就 不 会 发 生 了 。 然 而 ， 它 们 可 能 是 最 容易 理解 的 例子 。 但 关键 的 一 点 


























是 我 们 确实 需要 这 些 控制 。 同 时 探 人 


月 



































为 锁 〈locking)《〈 虽 然 不 仅仅 有 这 一 种 可 能 的 类 型 )。 





8.4 锁 























站 的 类 型 在 实际 应 用 中 也 是 可 以 见 到 的 ， 被 称 


锁 的 基本 实现 原理 很 简单 ， 事 务 ZX7 需要 一 种 保证 ， 它 所 感 兴趣 的 对 象 不 能 
此 需要 在 该 对 象 上 加 锁 《〈 以 某 种 可 以 解释 的 











被 修改 ， 直 到 事务 7X7 执行 完毕 ， 











因 











方式 )。 获 得 锁 之 后 造成 的 影响 就 是 把 
某 种 可 以 解释 的 方式 )， 引 入 要 特别 




















其 他 事务 隔离 如 





E 讨 论 的 对 象 之 外 《同样 ， 以 


阻止 它们 去 修改 该 对 象 。7X7 能 够 继续 它 在 某 


























一 知识 领域 的 处 理 而 其 他 任何 事务 都 不 能 修改 该 对 象 ， 至 少 等 到 ZX7 释放 锁 〈 当 








然 不 能 等 到 ZX7 完全 执行 结束 )。 
通常 系统 中 支持 两 种 类 型 的 锁 ， 














享 锁 (S 锁 ， 
也 称 为 写 锁 )。 不 严格 地 讲 ，S 锁 是 可 以 相互 兼容 的 ， 但 X 锁 不 能 与 其 











也 称 为 读 锁 ) 和 排他 锁 (X 锁 ， 























举例 如 下 ，ZX7 和 7X2 是 不 同 的 、 但 可 以 并 行 执 行事 务 ， 那 么 : 











口 ” 只 要 7 在 对 象 p 上 持 有 XX 锁 ，7X2 在 对 象 p 上 





都 不 会 被 批准 。 











1 这 样 的 情况 在 实际 中 不 会 是 不 知道 的 。 寿 











E 乘 和 








飞机 时 ， 你 而 














FH 请 任何 类 








他 锁 兼 容 。 








型 锁 的 请 求 








到 过 你 的 座位 被 别人 占 








] 的 情况 吗 ? 
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口 ” 只 要 7Z7 在 对 象 上 持 有 S 锁 ，7X2 在 对 象 上 申请 XX 锁 的 请 求 被 拒绝 ， 
但 可 以 申请 S 锁 。 
因而 , 在 任意 给 定 的 时 间 内 ， 可 以 同时 有 很 多 事务 在 对 象 P 上 持 有 S 锁 , 但 是 
至 多 只 能 有 一 个 事务 在 对 象 p 上 持 有 X 锁 ， 在 后 面 的 例子 中 ， 没 有 其 他 的 事务 在 
对 象 上 持 有 任何 类 型 的 锁 。 
系统 使 用 上 述 描述 的 机 制 目 的 是 强化 协议 ， 保 证 不 会 发 生 图 8.2 和 图 8.3 中 提 
到 的 问题 。 下 面 解 释 了 该 协议 的 机 制 ( 但 超出 了 本 书 的 范围 ) '。 
口 ”事务 在 对 象 p 上 的 检索 请 求 就 暗示 着 在 对 象 p 上 加 S 锁 。 
口 ”事务 在 对 象 p 上 的 修改 请 求 就 暗示 着 在 对 象 p 上 加 XX 锁 。 注意 : 如 果 讨 论 
的 事务 已 经 在 对 象 p 上 加 了 S 锁 〔 在 实际 情况 中 这 是 非常 可 能 的 )， 那 么 
隐 式 的 加 锁 的 请 求 就 将 S 锁 升级 为 XX 锁 。 
口 ”在 这 两 种 情况 下 ， 如 果 隐 式 的 锁 请 求 没有 被 批准 (因为 一 些 其 他 的 事务 对 
该 对 象 持 有 冲突 的 锁 )， 那 么 发 出 请 求 的 事务 就 处 于 等 待 状态 ， 直 到 冲突 
的 锁 被 释放 。 
口 ”最 后 , COMMIT 和 ROLLBACK 都 会 使 所 持 有 的 锁 直 到 事务 结束 时 才 被 释放 。 


现在 我 们 来 看 看 前 面 的 协议 是 如 何 解决 
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p 的 值 


Transaction TX1 





是 DPI 运行 之 前 的 值 ， 所 以 TX2 不 














名 








8.2 和 图 8.3 



































中 说 明 


是 图 8.2 的 一 个 修改 版 本 ,表示 了 遵守 该 协议 下 的 事务 ZX7 和 7TX2 
首先 ， 7X1 要 修改 对 象 p, 则 获得 对 象 p 的 XX 锁 , 接着 7X2 试图 检 
然而 ，7X2 在 对 象 p 上 加 S 锁 的 隐 式 请 求 不 被 批准 ， 所 以 TX2 处 了 
后 ，7X1 被 回 滚 ，X 锁 被 释放 。 现 在 ZX2 退 日 



































依赖 于 


Transaction TX2 








等 待 状态 ， 获 得 对 象 p 的 S 锁 ,但 
个 未 提交 的 





聊 改 。 


的 问题 的 。 图 8.4 
的 交叉 执行 过 程 
索 同 一 个 对 象 p。 


等 待 状态 。 然 





o 


是 








update p : X lock 
























































EEE D : S lock? 
/* wait */ 

ed /* wait */ 

ROLLBACK /* resume : SS Lock */ 
vy 
time 
图 8.4 事务 ZX2 不 再 依赖 于 一 个 未 提交 的 修改 
1 该 协议 的 正式 名 称 为 “严格 的 两 段 锁 协议 ”。 实 际 上 ， 真 正 的 系统 中 一 般 采用 各 种 各 样 的 机 制 去 改 


进 这 个 协议 。 然 而 ， 此 部 分 的 









































首 述 已 经 远 远 超出 了 本 书 的 范围 。 
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回头 引用 一 下 ACID 特性 ， 看 看 这 个 锁 协 议 是 如 何 隔离 图 8.4 中 两 个 事务 的 。 

现在 转向 图 8.5， 它 对 图 8.3 进行 了 简单 地 修改 。 首 先 ，7XI 检索 对 象 p， 则 获 
得 对 象 p 的 S 锁 ， 接 着 TX2 检索 同一 个 对 象 p， 也 获得 该 对 象 的 S 锁 。7TXI 试图 修 
改 p， 这 个 请 求 会 发 出 一 个 加 XX 锁 的 请 求 ， 但 未 被 批准 ，7TXI7 则 处 于 等 待 状态 。 然 
后 TX2 也 试图 修改 p,， 相似 的 理由 也 会 使 TX2 处 于 等 待 状态 , 现在 两 个 事务 都 不 能 
继续 执行 了 ， 所 以 不 会 产生 任何 修改 的 丢失 。 另 一 方面 ， 也 没有 正在 执行 有 用 的 工 
作 。 换 铝 话说， 我 们 通过 把 它 转化 为 另 一 个 问题 的 方式 解决 了 丢失 修改 问题 〈 但 至 
少 解 决 了 最 初 的 问题 )。 产 生 的 新 问题 称 为 死 锁 (deadlock)。 


Transaction TX1 Transaction TX2 






































































































































retrieve p : S lock 
retrieve p : S lock 


update p : X lock? 
/* wait */ 


ai update p : X lock? 
y* Wait * Walt 
/Wale < /* wait */ 
vy 
time 





图 8.5 没有 丢失 的 修改 ， 但 产生 了 和 死 锁 

对 于 死 锁 问 题 典型 的 解决 方案 为 〈a) 选择 一 个 死 锁 的 事务 ， 作 为 “牺牲 者 ” 
将 其 回 深 ( 通 常 选择 最 年 轻 的 事务 ， 即 最 近 执 行 的 事务 ;(b)〉 作为 一 个 新 的 事务 ， 
重启 “牺牲 者 。 
























































8.5 SQL 的 讨论 


因为 我 不 想 在 后 续 的 章节 中 过 多 地 讨论 事务 〈 可 以 参见 本 书 第 三 部 分 )， 在 结 
束 本 章 时 ， 我 想 谈 谈 事务 中 经 常用 于 SQL 系统 的 一 些 事 情 〈 或 多 或 少 地 )。SQL 
实 支持 显 式 的 BEGIN TRANSACTION、COMMIT 和 ROLLBACK 语 铝 〈Tutorial D 中 
也 是 如 此 ) :， 它 对 锁 本 身 没 有 显 式 的 依赖 ， 即 没有 显 式 的 语法 来 申请 和 释放 锁 。 
这 就 意味 着 系统 可 以 自由 使 用 除了 锁 以 外 的 其 他 机 制 , 这 作为 并 发 控制 的 基础 。( 在 
Tutorial D 中 也 是 如 此 。) 但 是 SQL 确实 还 具有 其 他 的 特征 、 概 念 和 语句 可 以 处 理事 
务 (a) Tutorial D 中 是 不 具有 的 ; (b) 这些 也 远 远 超出 了 本 书 介 绍 的 范围 。 这 类 









































































































































































































































1 实际 上 ， 在 SQL 中 是 用 START TRANSACTION 来 代替 BEGIN TRANSACTION。 
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hl 











特征 的 一 个 简单 例子 就 是 它 具 有 事务 隐 式 开始 的 例子 ， 不 需要 执行 显 式 的 BEGIN 
TRANSACNTION 语 句 ， 但 是 这 样 的 特征 还 有 很 多 很 多 。 


到 














8.6 ”练习 


(出 自 于 2004 年 Addison-Wesley 出 版 的 An Introduction to Database Systems， 
第 8 版 ) 术语 调度 (schedule) 通常 用 于 多 个 事务 交叉 执行 时 的 检索 和 修改 操作 序 
列 《〈 例 如 ， 并 发 )， 下 面 的 调度 表示 了 事务 TT，7T2，…，7TI12 (a，b,，…， 有 hh 都 是 
数据 库 中 的 对 象 ) 操作 的 一 个 调度 序列 ， 如 图 8.6 所 示 。 



































































































































































































































攻 二 前 过 忆 区 
ime 七 0 了 (T1) RETRIEVE a } 
time t02 (T2) RETRIEVE b ， 
(PL) RETRIEVE C } 
(7T4) RETRIEVE Q ， 
(T5) RETRIEVE a } 
CT2Y RETRIEVE e } 
(7T2) UPDATE ee) 
(T3) RETRIEVE f ， 
{TT2) RETRIEVE 大 } 
(T5) UPDATE a) 
(T1) COMMIT } 
(T6) RETRIEVE a /7 
(T5) ROLLBACK ， 
(T6) RETRIEVE cc) 
(T6) YPDATE, :GG 公 
(T7) RETRIEVE 9 ， 
(T8) RETRIEVE nh ， 
(T9) RETRIEVE 9 ， 
(T9) UPDATE 9 ; 
(T8) RETRIEVE ee } 
(T7) COMMIT } 
(T9) : RETRIEVE h } 
(TE3) » RETRIEVE.G.» 
(T10) : RETRIEVE a } 
(T9) : UPDATE h } 
(T6) COMMIT ; 
(| RETRIEVE Cc } 
(T12) RETRIEVE qd ;} 
(T12) RETRIEVE C } 
(7T2) UPDATE f ， 
(T1121) UPDATE c) 
(T12) RETRIEVE a ;} 
(T10) UPDATE a ) 
(TL2) UPDATE Q ， 
a (T4) RETRIEVE gqg » 
DEMe: E360。 | ee 
图 8.6 ”事务 交叉 执行 的 调度 序列 
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假设 RETRIEVE p 获得 对 象 p 的 S 锁 (如果 成 功 的 话 )， 把 UPDATEp 锁 升 级 
为 X 锁 (如 果 成 功 的 话 )。 同 时 也 假设 所 有 的 锁 一 直 持 有 到 事务 结束 。 在 时 间 点 136， 
会 有 哪些 事务 处 于 等 待 状态 ， 请 画 出 等 待 图 。 此 时 有 死 锁 存在 吗 ? 















































8.7 ”答案 


在 时 间 点 好 6， 根 本 没有 一 个 事务 在 做 有 用 的 工作 ! 事务 ZI 、75、76 和 77 已 
经 执行 结束 (7Z7、76 和 77 成 功 结束 ，75 不 成 功 结束 )。 存 在 一 个 死 锁 ， 涉 及 的 
事务 有 72、73、79 和 78。 此 外 ，74 在 等 待 79，772 在 等 待 74，770 和 7717 都 
在 等 待 772。 我 们 可 以 通过 图 形 的 方式 表示 这 种 情况 〈 称 为 等 待 图 )， 在 图 8.7 中 ， 
(a) 顶点 代表 事务 ;(b〉 从 顶点 到 顶点 字 的 有 向 边 表 示 下 等 待 六 〈c) 从 顶点 
Zi 到 顶点 的 边 采用 数据 库 操作 对 象 的 名 称 和 i 等 待 的 锁 的 类 型 进行 标识 (看 
图 8.7)。 图 中 的 环 路 代表 发 生 了 死 锁 。 









































ha 










































































T10 T11 
a (xXx) -一 c(X) 
可 
7T12 
alx) | 
v 
T4 
g(s) | 
有 h(x) 
7T9— p78 
A | ets) 
9(S) | v 
T3 4 T2 
f(xX) 

















就 像 第 7 章 说 明 的 那样 ，Codd 对 关系 模型 的 介绍 将 研究 人 员 带 入 数据 库 管理 


第 9 章 


数据 库 设 计 


一 般 情况 下 ， 我 确实 不 做 设计 工作 。 
一 一 Anon: Where Bugs Go 

















的 很 多 方面 ， 其 中 一 个 方面 就 是 数据 库 设计 。 实 际 上 ， 设 计 理 论 是 一 个 内 容 相当 
丰富 的 领域 ， 其 自身 具有 很 丰富 的 文化 内 容 。 这 个 理论 本 身 讨论 如 下 问题 : 一 个 
“好 ”的 数据 库 设计 到 底 应 该 由 哪些 部 分 组 成 ? 一 个 “好 ”的 设计 应 该 如 何 实现 ? 
当然 ， 我 们 只 是 从 表面 描绘 了 这 些 事情 ， 但 是 ， 与 事务 一 样 〈 第 8 章 的 主题 )， 
对 数据 库 设 计 (或 数据 库 设计 理论 ) 的 熟悉 程度 是 基本 理解 数据 库 技术 内 容 的 一 个 


















































































































































重要 因素 。 
所 以 设计 理论 通常 是 关系 理论 中 的 一 个 固定 组 成 部 分 。 然 而, 它 不 是 关系 模型 














本 身 的 一 部 分 。 相 反 ， 它 是 建立 在 这 个 模型 顶层 的 独立 理论 。 实 际 上 ， 关 系 模型 本 
身 并 不 关心 数据 库 设计 得 “好 ”与 “ 坏 ”(Tutorial D 中 也 是 如 此 ， 更 不 用 说 SQL 也 

















是 如 此 了 ): 只 要 数据 库 至 少 是 关系 级 的 ， 就 要 遵守 信息 理论 ， 那 么 关系 模型 中 的 
所 有 概念 衣 














仍然 要 使 用 ， 特 别 是 关系 代数 中 的 所 有 运算 符 仍 然 要 发 挥 作用 。 因 而 ， 























如 果 数 据 库 设 计 得 不 好 ， 是 用 户 要 遇 到 困难 ， 而 不 是 关系 模型 本 身 “。 
顺便 说 一 下 ， 我 们 一 直 使 用 的 供应 商 -零件 数据 库 就 设计 的 很 好 〈 它 共有 三 个 
关系 变量 S、P 和 SP)， 我 希望 您 也 有 同感 。 实 际 上 ， 这 是 基本 常识 。 很 多 设计 理 

















































































































通过 某 种 方式 被 美化 成 基本 常识 , 这 是 相当 不 公平 的 。 说 它 是 规范 化 的 基本 


论 只 是 通 











常识 会 更 好 一 些 。 规 范 化 是 很 重要 的 ， 因 为 如 果 某 件 事情 被 规范 化 了 ， 就 会 有 固定 


的 机 





症 。 换 句 话说 , 我 们 可 以 采用 这 种 机 制 进行 工作 。 但 是 对 这 一 点 继续 讨论 的 话 
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又 会 离 我 们 要 讨论 的 范围 太 远 。 如 果 你 想 进一步 研究 ， 可 以 参照 我 的 另 一 本 书 














1 实际 上 DBMS 受到 的 破坏 更 多 ， 虽 然 被 破坏 的 程度 较 小 。 
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Database Desien and Relational Theory: Normal Forms and All That Jazz (2012 年 ， 


O’Reilly 出 版 )。 


9.1 无 损 分 解 


回顾 第 2 章 曾 提 到 的 关系 一 直 是 规范 化 的 〈 例 如 ， 首 先 必 须 








1NF)， 即 所 讨论 的 关系 中 的 每 个 元 组 都 必须 与 4 


个 定义 如 何在 关系 中 使 月 








的 ， 














是 第 一 范式 ， 即 





特定 的 标题 一 致 。 现 在 我 们 来 看 看 这 
但 我 们 要 把 它 扩 展 到 关系 变量 中 。 











定义 : 关系 变量 RR 是 INF， 当 日 仅 当 可 以 合法 赋值 给 R 的 每 个 关系 了 都 是 INF 
给 R 的 每 个 关系 + 中 的 每 个 元 组 应 该 满足 (a) 每 个 属 








的 。 当 且 仅 当 可 以 合法 赋值 
性 都 恰好 只 有 一 个 ;(b〉 除 此 之 外 ， 没 有 其 他 条 件 



































o 








当然 ， 满 足 这 个 定义 的 每 个 关系 变量 都 是 INF 的 。 但 是 这 个 定义 只 提供 了 一 
个 建立 关系 的 基本 条 件 。 也 就 是 说 ， 我 们 可 以 定义 一 系列 的 较 高 级 别 的 范式 ， 如 : 





























2NF、3NF 等 ， 这 样 ， 具 有 较 高 级 别 范式 的 关系 变量 就 具有 1NF 中 没有 定义 的 属性 。 






































我 们 来 具体 看 一 个 例子 ， 它 只 是 INF 的 ， 而 不 是 更 高 级 别 的 范式 。 图 9.1 给 出 











了 一 个 SPCT 的 关系 变量 的 样本 值 























| 


























其 属性 的 含义 与 前 面相 同 《〈 但 是 注意 


系 断 言 如 下 : 














遇 性 为 SNO、PNO、QTY 、CITY 和 STATUS， 











CITY 在 这 里 





指 的 是 供应 商 所 在 的 城市 )， 关 


Supplier SNO supplies part PNO in quantity OTY has status STATUS, and is 


located in 
city CITY 


3PCT 
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London 
London 
London 
London 
London 
Paris 

Paris 

paris 

London 
London 
London 














STATUS 








单 本 数据 
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从 图 中 就 可 以 看 出 这 个 设计 是 多 么 的 粳 糕 ,很 多 数据 都 是 见 余 的 , 即 很 多 的 信 




















上 县 都 被 重复 记录 了 多 次 。 特 别 是 ， 具有 特定 城市 的 供应 商 以 及 
的 数据 会 直接 或 间接 地 导致“ 修改 异常 ”。 
雅典 的 供应 商 S5， 直 到 该 供应 商 提 供 零 件 。 
除 供应 商 S3， 就 会 丢失 所 在 城市 为 巴黎 的 供应 


言 息 )。 





入 


对 





4 


应 商 出 现 了 多 次 。 而 且 ， 这 些 元 
插入 寞 第 ;我们 插入 位 导 
只 删 
商 信息 《 即 删除 了 过 多 的 


nn 





























修改 异常 ， 如果 我 们 把 SNO 为 S1、PNO 为 P1 的 元 组 中 供应 商 所 在 城市 
从 伦敦 改 为 罗马 ， 但 供应 商 S1 所 在 的 其 他 元 组 值 
存在 不 一 致 性 。 注 意 ， 如 果 有 完整 性 约束 条 件 保 说 








具有 特定 状态 值 的 供 












































不 变 ， 我 们 会 明显 发 现 
每 个 供应 商 必须 位 于 一 


















































个 城市 的 话 ， 我 们 不 能 保证 这 个 修改 可 以 执行 。 但 至 少 现在 假设 这 个 约束 
条 件 是 不 存在 的 。 下 一 节 中 我 将 详细 介绍 这 个 问题 。 
再 重复 一 次 ， 前 面 的 数据 库 设计 是 极 



































商 变 量 S〈 为 了 简化 ， 通 常 忽略 供 


9.2 所 示 ， 经 过 这 样 的 改变 后 ， 就 删除 了 数据 见 余 ， 因 





S11 20 









































显 : 我 们 需要 把 关系 变量 SPCT 蔡 换 成 两 个 单 
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London 
S2 10 Pa 
SS; 30 Pa 





20 
30 


S4 


S95 





名 








9.2 








可 以 看 出 , 分解 出 来 的 两 个 关系 变 





关系 变量 S (fh 


ris 
London 
Athens 























> 








公平 地 说 ， 至 少 容易 看 到 它 糟 糕 的 一 部 分 


可 能 是 不 太 容易 的 。 


1 到 














原因 














2 在 本 章 中 我 将 继续 省 略 供应 商 的 名 字 ， 









































3 除了 投影 关系 $ 中 的 供应 商 $5 的 元 组 ， 它 没有 








可 避免 搬入 异常 的 )。 





如 














化 后 》 和 SP 〈 样 本数] 
S 和 SP 都 是 关系 变量 SPCT 的 投 


是 这 个 例子 相当 


其 糟糕 的 ，。 解 决 这 个 问题 的 答案 也 很 明 

独 的 关系 变量 ， 一 个 就 是 常用 的 供应 

应 商 名 字 )“， 另 一 个 是 供应 关系 变量 SP。 如 图 
而 避免 了 修改 异常 。 





SP 














CN OO 











/3 
尿 2 ， 


而 且 ， 








由 
虚 





用 中 发 现 见 余 和 异常 











。 在 实际 应 














直到 特殊 说 明 。 
出 现在 SPCT 的 元 组 中 (这 是 为 了 特殊 说 明 分 解 是 
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如 果 我 们 把 这 些 投影 再 联接 在 














起 ， 就 要 恢复 成 原来 的 关系 变量 。 因 而 ， 从 这 个 例 





子 可 以 得 出 如 下 结论 (或 者 至 少 是 强烈 建议 的 ): 更 高 级 别 的 范式 (如 2NF、3NF 


等 等 ) 应 该 满足 (a) 可 以 通过 执 
余 ;(c) 分 解 前 的 关系 变量 应 该 等 价 于 这 些 扫 
所 以 分 解 过 程 必须 是 无 损 的 〈 当 然 ,在 这 个 过 程 中 我 们 不 能 丢失 任何 信息 是 非常 重 
要 的 )。 同 时 ， 就 像 我 们 已 经 看 到 的 ， 分 解 之 后 的 
这 个 过 程 被 认为 是 进一步 的 规范 化 , 或 者 简称 为 



































的 方式 来 分 解 一 个 关系 变量 ;(b〉 可 以 消除 元 
的 联接 。 因 为 要 特别 考虑 到 (c)， 

















果 是 更 高 级 别 范式 的 关系 变量 ， 
纲 范 化 。 另 外 当 我 们 讨论 分 解 过 程 























时 ， 因 为 (a) 和 (c) 要 被 放 在 一 起 ， 所 以 我 们 通常 说 投影 就 是 分 解 运算 符 ， 联 接 











就 是 相应 的 分 解 运算 符 。 因 此 , 设 1i 
要 依赖 于 关系 模型 中 的 特定 特 和 


y 











节 曾 经 提 到 过 。 


























二 理论 (或 者 我 们 这 





























讨论 的 设计 理论 的 一 部 分 ) 


其 是 依赖 于 投影 和 联接 运算 符 , 这 在 前 面 章 











术语 说 明 : 严格 地 讲 ， 术 语 投影 和 联接 在 前 面 的 段落 中 必须 加 上 3 引号。 从 本 书 第 一 部 
分 可 以 看 到 ， 这 是 因为 这 些 运算 符 实际 上 是 应 用 于 关系 而 不 是 关系 变量 。 当 然 ， 我 们 也 可 
以 这 样 说 “R 是 RI1 和 R2 的 联接 ”"， 这 里 的 R、RI 和 R2 是 关系 变量 ， 但 我 们 这 样 说 的 意思 
通常 是 指 尺 的 当前 值 关 系 了 等 价 于 7 和 72 的 联接 , 这 里 7r] 是 RI 的 当前 值 , r2 是 R2 的 当 
前 值 。 但是， 现在 我 们 采用 这 种 说 法 与 其 本 身 的 含义 稍 有 不 同 。 特 别 是 在 规范 化 的 情况 下 ， 
当 我 们 说 R 是 RI1 和 R2 的 联接 时 ， 只 有 在 任 一 特定 时 间 下 RR 的 当前 值 关系 + 等 价 于 rl 和 
12 的 联接 (这 里 7 是 RI 的 当前 值 ，r2 是 R2 的 当前 值 ) 时 ， 才 保证 一 直 取 值 为 真 ( 如 果 
你 感 党 有 些 糊 涂 的 话 ， 我 真 的 要 说 声 抱歉 。 但 有 时 明确 这 些 说 法 是 非常 重要 的 )。 


9.2 ”函数 依赖 












































被 决定 因素 (dependent)。 


举 个 例子 ， 函 数 依赖 FD {SNO} 一 {CITY} 来 自 于 关系 变量 SPCT (一 个 供 











在 前 面 的 章节 中 我 曾经 提 到 , 必须 满足 完整 
位 于 一 个 城市 。 规 范 地 讲 ,约束 是 函数 依赖 的 一 利 
念 ( 它 们 通常 被 描述 为 “不 是 非常 

定义 : 了 和 了 是 关系 变量 R 两 个 属 
中 成 立 , 当 且 仪 当 如 果 属 性 集合 对 中 每 个 属性 的 值 
合 7 中 每 个 属性 的 值 构成 的 集合 , 则 
属性 集合 了 中 的 属性 有 时 也 称 作 函数 依赖 X= 了 的 决定 基 





























础 的， 但 接近 

















条 


















































约束 条 件 是 指 每 个 供应 商都 只 能 
Fh。 函 数 依赖 是 一 个 相当 重要 的 概 
础 的 概念 )。 这 里 给 出 定义 : 
P 么 函数 依赖 (FD) X 一 Y 在 RR 
构成 的 集合 唯一 地 决定 了 属性 集 
刷 性 集合 了 函数 依赖 于 属性 集合 X, 记 为 :XY。 















































素 (determinant), 了 称 为 

















应 商号 码 可 以 找到 唯一 对 应 的 城市 )。 当 然 ， 关 系 变量 SPCT 中 也 存在 函数 依赖 








{SNO} 一 {STATUS}， 因 此 ， 我 们 可 以 





{ SNO } 一 人 CITY ， 











巴 这 两 个 函数 依赖 进行 合并 简化 ， 如 下 : 

















一 {CITY} 的 情况 下 
使 恰好 有 时 


























果 需 要 唤 本 

下 面 讨论 码 。 
对 于 R 中 的 每 个 属 
必须 是 相同 的 元 组 


K—X 





这 个 函数 依赖 对 于 R 的 所 有 子 集 蕊 都 成 立 。 
4 


在 函数 依赖 ， 但 
他 的 函数 依赖 ， 那 





些 非 码 的 函数 依赖 ， 


是 但 。 


最 小 函数 依赖 


蛆 记忆 的 话 ， 请 参见 第 3 章 


， 它们 也 





注意 , 这 里 使 用 的 是 大 括号 。X 和 7 都 是 R 的 子 集 ， 
， 它 们 也 是 单独 的 集合 。 以 此 类 
它们 的 度 为 1 
所 熟悉 的 情况 是 具有 相似 属 











。 如 果 这 些 注释 给 了 您 提醒 ， 
FE 的 , 例如 , 关键 字 是 属性 的 
练习 3.2 的 答案 )。 
假设 关系 变量 R 的 码 为 K， 那 么 序 
性 都 成 立 。 即 如 果 尺 中 的 两 个 元 组 具有 相同 的 天 值 
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因此 也 是 集合 , 即使 在 {SNO} 
E，X 和 7 的 值 也 都 是 元 组 ， 即 
也 是 因为 这 些 情况 与 您 现在 
集合 , 关键 字 值 也 是 元 组 (如 










































































存在 函数 依赖 FD: K 一 { 4}， 
， 那 么 它们 















































区 
上 月 息 

















k 有 相同 的 属性 值 。 














男 一 种 表示 方式 如 下 : 























因而 ， 除 了 码 之 外 的 属性 也 存 





数 依赖 中 的 决定 因 














素 都 是 码 。 不 严格 地 讲 ， 如 果 存 在 任何 其 





么 这 个 设计 就 很 糟 料 。 观 察 关系 变量 SPCT， 我 们 可 以 写 出 一 


如 : 











在 讲 更 高 





赖 X— 了 Y， 那 么 就 存在 函数 依赖 X 一 了 ， 
名 话说 ， 你 可 以 向 决定 
得 到 关系 变量 中 的 函数 依赖 。 
{ CITY ,STATUS }, 





[== 











素 中 增加 了 
了 一 了 成立, 1 
就 是 
就 是 
函数 依赖 {SNO} 一 














最 小 函数 依赖 。 





人 一 二 


9.3 


下 面 给 出 2NF 


盟 性 PNO， 
日 函数 


咱 一 沁 








{SNO} {CITY}.、 


{SNO} 一 {STATUS}, 但 {SNO} 不 








级 范式 之 前 我 需要 再 介 乡 





个 概念 。 如 果 关 系 变 量 尺 中 存在 函数 依 











则 
从 被 决定 因 











因素 中 添加 属性 , 或 者 从 被 决定 因素 中 减少 属性 ， 
例如 ， 关 系 变量 
函数 依赖 { SNO ,PNO } 一 { CITY } 也 是 成 立 的 (向 决定 























“是 了 的 子 集 ，Y 了 “是 了 的 子 集 。 换 
仍然 可 以 
SPCT 中 存在 函数 依赖 { SNO 疡 
因 

















素 中 减少 了 属性 STATUS。 那 么 ， 如 果 函 数 依 赖 
康 赖 对 一 了 “对 于 和“ 任意 的 子 集 








了 都 不 成 并 ,那么 XY 一 了 





例如 ,关系 变量 SPCT 中 的 函数 依赖 { SNO , PNO } 一 {QTY } 





最 小 函数 依赖 ， 但 { SNO , PNO } 一 { CITY } 不 是 〈 因 


{CITY) )。 


式 


的 确 








切 定义 。 














定义 : 关系 变量 R 是 第 二 范式 (2NF)， 当 








顾 第 2 











练习 2.7 的 答案 ， 其 中 详 




















为 在 该 关系 变量 中 存在 





且 仅 当 R 中 的 每 个 码 K 和 的 每 个 





细 解 释 了 元 组 的 度 的 含义 。 
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非 码 属性 4， 
指 R 的 属 














其 函数 依赖 天 一 {4} 是 不 能 
属性 不 是 码 的 组 成 部 分 。 
现在 我 可 以 来 明确 解释 一 下 关系 变量 





变量 都 是 INF) 而 不 是 2NF 了 。 
{SNO ,PNO} — {CITY}、 {SNO ,PNO} 一 
因此 在 关系 变量 SPCT 中 存在 见 余 
步 规 范 化 就 需要 采 月 


依赖 : 
依赖 











既然 SPCT 不 是 
解 〈 当 然 是 
可 以 有 





























是 可 以 进行 简化 的 。 





原 








2NF 的 ， 要 进 一 


























E 徊 化 的 。 注意， 关系 变量 的 非 码 属性 是 





{STATUS} 









































时 SPCT 为 什么 是 INF ( 因 
因 如 下 ，(a) (NO NOOR 








为 它 所 有 的 关系 
(b) 、 




















的 资源 。 

投影 的 方式 对 它 进行 分 
采用 无 损 方式 进行 分 解 )。 这 里 有 一 个 很 重要 的 公理 ， 即 Heath 公理 ， 
于 你 对 这 个 问题 的 理解 。 
Heath 公理 : 关系 变量 
并 集 与 甩 相 等 。 XY 表示 处 了 的 并 集 ， 

















R 具有 标题 ( 即 属性 ) 万 ， 外 了 Z 是 万 的 子 集 ,， XY 了 Z 的 
了 2 表示 所 QZ 的 并 集 ， 如 果 尺 中 存在 函数 依赖 和 -> 也 














属性 集 4,B,C} 〈 本 身 都 是 单独 的 属性 ， 

















里 告 诉 我 们 ，R 可 以 被 








那么 RR 就 等 于 其 投影 XY 和 XZ 的 联接 ， 它 可 以 无 损 地 分 解 成 这 些 投影 . 
作为 该 公理 的 一 个 特例 ， 如 果 R 具有 
来 代替 属性 集合 )，R 中 存在 函数 依赖 {4} 一 {B83}， 那 么 该 公 
无 损 地 分 为 RI 和 R2， 具 体 如 下 : 


RI1 {A,B), 
R2{A,C}, 
下 面 给 出 

等 价 的 ( 
定义 : 

了 Y， 人 至 少 满足 如 下 条 伯 


{ 4 





[| 
Ea 











虽然 我 省 略 了 订 








} 是 码 ; 








2NF 的 另 一 个 定义 来 结束 本 节 。 可 以 证 
F 明 过 程 )， 但 有 时 这 个 定义 更 有 
关系 变量 R 是 2NF， 当 且 仅 当 R 中 存在 的 每 一 个 非 平凡 的 函数 依赖 XY 一 
超 码 ; 





F 之 一 : (a) 对 是 

















要 再 解释 


下 ! 








{4} 是 外 码 ，RI 是 参照 关系 。 























用 。 








(b) 了 是 子 人 码 ; 


明 这 个 定义 与 前 面 的 定义 是 





(c) 对 不 是 子 人 码 。 


第 一 ， 函 数 依赖 是 平凡 的 ， 当 且 仅 当 它 是 永远 成 立 的 《〈 即 它 不 可 能 不 成 立 )。 
， 下 面 的 函数 依赖 都 是 平凡 的 : 





在 关系 变量 SPCT 中 


{ SNO ， 
{ SNO } 





事实 上 ， 很 容易 看 到 ， 如 果 函 数 依赖 是 平凡 的 ， 当 
因素 ) 是 左边 的 子 集 (决定 
R 的 超 码 是 R 标题 


赖 








AAA 一 


第 二 ， 关 系 变量 


ENO } 一 { SNO } 
>» { SNO } 





因素 )。 








必 是 经 过 


定 都 是 码 〈 不 是 码 的 超 码 是 超 码 的 真子 集 )。 另 外 还 要 注意 ， 如 果 SK 是 RR 的 





且 仅 当 函 数 依赖 的 


右边 〈 依 

















简化 的 (参见 第 3 章 )。 注 意 ， 


所 有 的 码 都 是 超 码 ， 


























那么 R 中 就 需要 存在 函数 依赖 SK 一 {4}。 
16。 这 个 统计 中 包含 了 码 {PNO} 和 整个 标题 。 


案 : 


的 





狠 码 。) 








的 子 集 SK，R 的 码 必须 具有 了 唯 


练习 : 0 P 了 中 有 和 多少 
， 关 系 变 量 R 的 标题 总 是 R 





性 ， 但 不 
但 是 大 多 数 超 码 不 一 
超 码 ， 
超 码 ? 〈 答 














> 个 











9.4 第 三 范式 119 











第 三 ， 关 系 变 量 R 的 子 码 是 R 的 码 的 子 集 。 因 而 ， 所 有 的 码 都 是 子 码 ， 但 大 
多 数 子 码 不 是 码 〈 不 是 码 的 子 码 是 子 码 的 真子 集 )。 练 习 : 供应 关系 变量 SP 有 多 少 
个 子 码 ? (答案 : 4。 这 个 统计 包括 了 码 {SNO，PNO} 和 空 集 入。 注意 ， 空 集 是 任 
意 关 系 变量 RR 的 子 码 。) 
码 的 规格 说 明 注释 : 假设 关系 变量 及 的 定义 中 包含 了 对 码 世 } 的 规格 说 明 ,， 那么 我 们 可 
以 说 这 种 规格 说 明 的 意思 就 是 指 玉 是 尺 的 码 。 然 而 ,严格 地 讲 ， 它 真正 的 含义 是 玉 是 刃 的 
超 码 ! 这 一 点 表明 ， 当 系统 能 够 也 肯定 会 满足 KEY 规格 说 明 中 暗示 的 唯一 性 属性 时 ， 它 就 
不 能 满足 相应 的 不 可 简化 性 。 比 如 ， 零 件 关系 变量 P， 因 为 我 们 知道 了 该 关系 变量 的 含义 
(例如 ， 我 们 了 解 相应 的 断言 )， 那么 属性 集合 {PNO，CITY} 就 不 具有 不 可 简化 性 (虽然 它 
具有 唯一 性 )。 再 重复 一 下 ， 我 们 知道 ， 但 系统 是 不 知道 的 。 所 以 如 果 我 们 用 {PNO，CITY} 
代替 {PNO} 来 作为 码 ， 对 于 该 关系 变量 ， 系 统 就 不 能 满足 零件 号 本 身 的 约束 条 件 ， 这 个 约 
束 条 件 与 PNO-CITY 组 合 相 反 ， 它 是 具有 唯一 值 的 。 换 多 话说 ， 当 我 们 用 KEY{K} 作 为 关 

系 变 量 定义 的 一 部 分 时 ， 系 统 就 可 以 保证 { 队 是 超 码 ， 但 不 一 定 是 码 。 

































































9.4 第 三 范式 

现在 通过 另外 一 个 例子 来 讨论 第 三 范式 (3NF)。 假 设 供应 商 关 系 变量 中 还 有 
一 个 函数 依赖 {CITY} 一 {STATUS} (如 图 9.3 所 示 ，(a) 为 了 和 新 的 函数 依赖 一 致 ， 
修改 了 供应 商 S2 的 状态 值 ，(b) 重新 恢复 了 供应 商 名 字 属 性 SNAME )。 


SNO SNAME STATUS CITY 


20 London 
30 paris 
30 Paris 
20 London 
30 Athens 

























































































图 9.3 有 函数 依赖 {CITY} 一 {STATUS} 的 关系 变量 s 一 一 样本 值 


经 过 修改 后 ， 它 是 2NF 的 ， 您 可 以 自己 检测 一 下 。 然 而 它 不 是 3NF 的 (看 下 
面 的 定义 )， 因 此 你 可 以 看 到 ， 仍 然 存在 数据 匈 余 (特别 是 ， 对 于 给 定 的 城市 ， 其 
状态 值 要 重复 出 现 多 次 )。 

定义 : 关系 变量 R 是 3NF 的 ， 当 且 仅 当 R 中 的 每 个 非 平 几 函 数 依赖 一 了 满 
足以 下 两 个 条 件 之 一 : (a) 了 是 超 码 ;，(b) 了 是 子 码 。 

因此 ， 可 以 看 到 图 9.3 给 出 的 关系 变量 S 不 是 3NF 的 ， 因 为 (a) 存在 函数 依 
赖 {CITY} 一 {STATUS};(b) 该 函数 依赖 显然 是 非 平凡 的 ; 〈c) {CITY} 不 是 超人 码 、 
{STATUS} 不 是 子 码 ; (d) 所 以 ， 该 关系 变量 不 是 3NF， 其 中 存在 着 元 余 的 资源 。 
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既然 给 定 的 关系 不 是 3NF 的 ， 规 范 化 原理 就 要 求 通过 投影 进行 分 解 〈 当 然 是 











采用 无 损 的 方式 ), 采用 Heath 公理 , 可 以 得 到 两 个 投影 , 一 个 是 在 SNO、SNAME、 
CITY 上 的 投影 ， 另 一 个 是 在 CITY 和 STATUS 上 的 投影 。 练 习 : 检查 这 个 分 解 是 











否 (a) 满足 Heath 公 





























里 的 条 件 ;，(b) 是 无 损 的 ; 


(c) 删除 了 宛 余 信息 。 


























顺便 说 一 下 ， 如 果 把 3NF 的 定义 与 2NF 的 第 二 个 定义 做 比较 ， 你 会 发 现 那个 
3NF 的 关系 变量 一 定 是 2NF《〈 反 过 来 是 不 一 定 的 )。 这 种 情况 通常 采用 如 下 简化 的 

















方式 说 明 : 3NF 一 定 是 2NF。 


9.5 ”BC 范式 





最 后 ， 我 们 介绍 一 下 BC 范式 (BCNF )， 它 确实 是 











给 出 其 定义 。 
































函数 依赖 中 一 种 范式 。 下 面 


定义 : 关系 变量 R 是 BCNF 的 , 当 且 仅 当中 的 每 一 个 非 平 几 函 数 依赖 一 了 





中 ， 天 是 超 码 。 














现 ， 满 足 BCNF 的 函数 依赖 或 者 是 
者 是 来 自 超 码 的 函数 依赖 (显然 我 介 





























调 一 下 ， 虽 然 这 句 话 很 有 趣 、 很 吸引 




















首先 要 注意 的 是 ，BCNF 肯定 是 3NF 〈 但 反 过 来 不 一 定 成 立 )。 另 外 也 可 以 发 
平凡 的 《〈 显 





然 我 们 不 能 抛 掉 这 些 函 数 依赖 )， 或 





] 也 不 能 抛 挥 这 些 依赖 )。 因 为 有 些 人 喜欢 说 : 
“每 个 事实 都 是 关于 码 的 事实 ， 是 整个 码 ， 除 了 码 之 外 就 什么 都 不 存在 了 。” 我 要 强 
人 的 ， 但 这 个 非 正规 的 属性 不 完全 是 对 的 ， 因 
为 它 假 设 了 所 有 其 他 的 事情 都 只 有 一 个 码 。 















































下 面 举 一 个 属于 3NF 但 不 属于 BCNF 的 例子 。 将 供应 关系 变量 修改 一 下 ， 称 
之 为 SNP， 它 增加 了 一 个 属性 SNAME， 代 表 了 可 接受 的 供应 商 的 名 字 。 另 外 假设 














供应 商 名 字 都 是 唯一 的 〈 例 如 ， 没 有 两 个 供 





























应 商 在 同一 时 刻 具 有 相同 的 名 字 。 


ve 
壮 局 在 
/区 、》 
































本 书 其 他 地 方 我 没有 明确 做 出 这 种 假设 )。 下 
面 是 SNP 的 样本 数据 ， 如 图 9.4 所 示 。 
从 图 9.4 可 以 看 到 ， 这 个 例子 中 仍 存在 





见 余 : 供应 商 S1 的 每 个 元 组 都 告 人 














的 名 字 为 Smith， 供 应 商 $S2 的 每 个 元 


a 
万 





诉 我 们 S2 的 名 字 Jones 等 等 。 同 样 ，Smith 的 








每 个 元 组 都 告诉 我 们 Smith 的 供应 商号 是 S1, Jones 的 每 个 元 组 告诉 我 们 Jones 的 供应 























图 9.4 SNP 的 样本 数 届 











二 











1 公正 地 说 ，BCNEF 应 该 称 为 第 四 范式 《实际 上 ， 它 几乎 满足 了 第 四 范式 )， 但 不 地 的 是 ， 到 它 被 广泛 


























理解 以 及 评价 其 重要 性 时 ， 男 一 种 范式 (该 范式 已 经 超出 了 本 





BB 的 范围 ) 已 经 被 命名 为 第 四 范式 了 。 


商号 为 S2 等 等 。 





因此 ， 该 关系 变量 


不 是 BCNF 的 。 首 
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先 ， 它 有 两 个 码 ， 即 {SNP， 


PNO} 和 {SNAME，PNO}'; 第 二 ， 标 题 的 每 个 子 集 (特别 是 {QTY}〉 都 函数 依赖 




















{SNO}， 这 些 函 数 依 赖 


于 这 两 个 码 ; 然而 ， 第 三 ， 存 在 函数 依赖 {SNO} 一 
肯定 不 是 平凡 的 ， 函 数 依赖 的 决定 因 









































个 两 种 情况 下 的 依赖 





是 BCNF 的 (但 它 是 3NF 的 ， 因 为 两 
最 后 ,我 再 重申 一 下 规范 化 原型 


























{SNAME} 和 {SNAME} 一 
素 也 不 是 超 码 ， 因 





此 不 


因素 都 是 子 码 )。 


EE 如 果 关 系 变量 尺 不 是 BCNF， 那 么 就 采用 投 


影 技术 进行 分 解 。 比 如 SNP， 下 面 的 两 种 分 解 都 可 以 实现 此 目的 : 
口 ”分 别 在 {SNO，SNAME} 和 {SNO，PNO，QTY} 上 投影 ; 
口 ”分 别 在 {SNO，SNAME} 和 {SNAME，PNO，QTY} 上 投影 。 





9.6 结论 














再 重复 




















范 化 为 BCNF。 但 也 要 注意 ， 
义 ! 




















口 





面 几 点 可 以 回答 这 个 问题 。 


























研究 2NF 和 3NF 同样 可 以 
些 范式 被 顺序 地 称 为 
最 后 ， 研 究 2NF 和 3NF 也 
误 在 哪里 ? 实际 上 ，BCNF 



































下 ，BCNF 也 属于 一 种 范式 ， 
重要 的 是 ， 它 们 是 把 关系 规范 化 成 BCNF 的 基础 。 换 一 种 说 法 ，BCNF 是 实际 数据 
库 中 最 重要 的 一 种 范式 , 数据 库 设 计 人 员 通 常 都 应 该 努力 保 说 



































研究 2NF 和 3NF 可 以 帮助 人 们 更 好 地 、 逐 渐 地 到 
它们 的 设计 理论 (特别 是 函数 依赖 )。 
[以 帮助 人 们 了 解 设计 理论 发 


We 


息 一 





~» 光一 )。 





可 
规定 : 疯 数 依赖 ， 

















何 违反 这 个 条 件 呢 ? 简单 








因此 ，2NF、3NF 本 身 3 











不 是 非常 重要 ， 











E 把 所 有 的 关系 变量 规 
BCNF 从 定义 上 来 说 比 2NF、3NF 简单 ， 这 是 因为 定 
没有 提 到 不 可 简化 的 函数 依赖 、 非 码 属性 、 子 人 码 等 等 。 
既然 是 这 样 ， 为 什么 还 要 定义 2NF、3NF? 为 什么 在 本 章 还 要 提 到 它们 呢 ? 下 






































E 解 更 高 


级 范式 ， 以 及 








展 的 历史 (为 什么 这 


以 帮助 我 们 找 出 关系 变量 不 是 BCNF 时 ， 错 








~ ZZ 日 LI 
2 贝 十 出 








于 对 人 码 的 依赖 。 如 














点 说 ， 基 本 上 有 2 种 方式 : (a) 可 以 有 对 真子 





码 的 函数 依赖 (在 这 种 情况 下 ， 关 系 变量 不 是 2NF), 或 者 (b) 可 以 有 对 


























非 码 的 函数 依赖 (这 种 情 
最 后 我 


























况 下 ， 关 系 变量 不 是 3NF )。 
再 说 明 几 点 来 结束 本 章 的 内 容 。 














DBCNF 是 函数 依赖 中 的 最 终 范式 ， 但 它 肯定 不 是 最 终 范式 ， 因 为 还 有 几 个 
更 高 一 级 的 范式 至 少 有 6 个 或 7 个 )。 然 而 ， 从 实用 的 角度 看 ，BCNF 











1 这 是 因为 表示 样本 数据 时 ， 没 给 出 容易 引起 误解 的 下 划 线 。 它 有 两 个 码 ， 而 且 没 有 更 好 的 理 








明 它 们 哪 一 个 可 以 作为 主 码 ， 它 们 几乎 是 等 价 的 。 




















去 说 











122 第 9 章 数据 库 设 计 














肯定 是 最 重要 的 一 个 。 

口 ”规范 化 是 很 重要 的 。 但 是 在 设计 理论 中 还 要 涉及 更 多 的 内 容 ， 就 像 在 
Database Desien and Relational Theory: Normal Forms and All That Jazz 
(2012 年 ，O”Reilly 出 版 ) 一 书 中 提 到 的 ， 我 在 本 书 前 面 章 节 中 曾 提 到 过 。 































































































9.7 练习 


9.1 在 本 章 内 容 中 ， 我 曾经 提 到 ， 关 系 变量 SPCT (参见 图 9.1) 存在 如 下 的 
插入 异常 : 我 们 不 能 插入 供应 商 $5 的 城市 信息 Athens, 直到 该 供应 商 提供 了 零件 。 
当然 ， 我 们 也 不 能 插入 供应 商 $5 的 状态 信息 30， 直 到 该 供应 商 提供 了 零件 。 那 么 
切 的 原因 是 什么 ? 

9.2 ”供应 关系 变量 SP 中 有 多 少 个 函数 依赖 ? 哪些 是 平凡 的 函数 依赖 ? 哪些 是 
不 可 简化 的 函数 依赖 ? 
9.3 ”就 像 在 本 章 内 容 中 强调 的 ， 一 个 函数 依赖 就 是 一 种 特定 的 完整 性 约束 
条 件 。 请 采用 Tutorial D 的 CONSTRAINT 语句 表示 关系 变量 SNP 的 函数 依赖 : 
{SNO} 一 {SNAME}、{SNAME} 一 {SNO}。 可 以 参见 本 书 9.5 节 BCNE 部 分 。 

9.4 根据 你 的 工作 环境 ， 请 按照 如 下 要 求 给 出 几 个 例子 : 〈a) 关系 变量 不 是 
2NF; (b) 关系 变量 是 3NF， 但 不 是 2NF; (c) 关系 变量 是 BCNF， 但 不 是 3NF。 

9.5 ”考虑 本 书 9.4 节 “ 第 三 范式 ”部 分 讨论 的 供应 商 $ 的 关系 模式 ， 该 关系 变 
量 的 修改 异常 有 哪些 ? 

9.6 (出 自 2004 年 ，Addison-Wesley 出 版 的 An Introduction to Database Systems 
第 8 版 。) 一 个 确定 的 数据 库 中 包含 公司 部 门 和 员工 等 信息 ， 如 下 : 

一 个 公司 有 若干 部 门 组 成 ; 

口 ”每 个 部 门 有 若干 员工 ， 若 干 项 目 ， 若 干 办 公 室 ; 

口 ”每 个 员工 有 一 段 工 作 经 历 ( 多 个 员工 就 有 多 个 ); 

口 ” 对 于 每 一 项 工作 , 员工 都 有 对 应 工资 (雇用 期 间 , 这 个 工作 会 对 应 多 个 工资 ); 
口 ”每 间 办 公 室 有 若干 电话 。 
要 求 设计 的 数据 库 包 含 如 下 信息 。 

口 部门: 部 门 号 (唯一 的 )， 部 门 预 算 ， 部 门 经 理 的 员工 号 (唯一 的 ); 
员工 员工 号 《唯一 的 )， 当 前 的 项 目 号 ， 办 公 室 号 码 ， 电 话 号 码 ， 员 工 
目前 工作 的 名 称 〈 包 括 工 作 的 日 期 以 及 该 项 工作 对 应 的 工资 ); 

口 “ 每 个 项 目 : 项 目 号 ， 项 目 预 算 ; 
口 ”每 间 办 公 室 : 办 公 室 号 码 ( 唯 一 的 )， 面 积 ， 所 有 电话 的 号 码 〔 唯 一 的 )。 
请 设计 一 组 恰当 的 关系 变量 来 表示 这 些 信息 ， 并 说 明 函 数 依赖 中 存在 的 一 些 假 设 。 
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Ar 一 一 
9.8 合 亲 
9.1 因为 没有 零件 号 p 和 供应 数量 
has status 30, and is located in city Athens 
量 SPCT 中 供应 商 $5 的 断言 没有 被 初始 化 ， 就 不 能 被 判断 为 真 或 假 。 
9.2 关系 变量 SP 
闭 包 。 但 关系 代数 中 还 没有 办 法 能 够 处 理 这 些 闭 包 ，。 
{ SNO , PNO , QTY } { SNO , PNO , QTY } 
{ SNO , PNO , QTY } { SNO , PNO } 
{ SNO , PNO , QTY } NO 
{ SNO , PNO , QTY } { PNO , QTY } 
lr { SNO } 
{ SNO , PNO , QTY } { PNO } 
{ SNO , PNO , QTY } { QTY } 
{ SNO , PNO , QTY } 全 法 
{ SNO , PNO } { SMO PNG ;OLY 1 
{ SNO , PNO } { SNO , PNO } 
{ SNO , PNO } { SNO , QTY } 
{ SNO , PNO } { PNO , QTY } 
{ SNO , PNO } { SNO } 
{ SNO , PNO } { PNO } 
{ SNO , PNO } { QTY } 
{ SNO , PNO } (a 
le i { SNO , QTY } 
{ SNO , QTY } { SNO } 
{ SNO , QTY } { QTY } 
{ SNO , QTY } { } 
{ PNO , QTY } { PNO , QTY } 
{ PNO , QTY } { PNO } 
{ PNO , QTY } { QTY } 
f PNO, -QTY, } € } 
{ SNO } { SNO } 
{ SNO } 人 对 
{ PNO } { PNO } 
{ PNO } {. 
{QTY } { QTY } 






































9.8 答案 123 


q, Supplier SS supplies partp in quantity gq, 
就 不 是 一 个 真 的 断言 。 换 名 话说 ， 关 系 变 


PP 包含 了 31 个 函数 依赖 。 规 范 地 说 ， 这 些 函 数 依赖 中 存在 
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非 平凡 的 函数 依赖 只 有 4 个 : 





{ SNO , PNO } »> { SNO , PNO , QTY } 
{ SNO , PNO } »> { SNO , QTY } 
{ 
{ 





Q1 
SNO ;PNO 3 E :BNO .OPTY |} 
SNO , PNO } — { QTY } 





只 有 下 面 7 个 函数 是 不 可 简化 的 : 

















{ SNO , PNO } -> { SNO , PNO , QTY } 
{ SNO , PNO } -> { SNO , PNO } 

{ SNO , PNO } -> { SNO , QTY } 

{ SNO , PNO } -> { PNO , QTY } 

{ SNO , PNO } -> { QTY } 








{ SNO } 3» SNO 

{ PNO } 一 { PNO } 

€ “OTYE:'} —» { QTY } 

{ } —» { |} 

9.3 CONSTRAINT C9A COUNT ( SNP { SNO, SNAME } ) = COUNT ( SNP { SNO } ); 
CONSTRAINT C9B COUNT ( SNP { SNO, SNAME } ) = COUNT ( SNP { SNAME } ) ; 

9.4 答案 略 








9.5 ”插入 异常 : 对 于 给 定 的 城市 ， 我 们 不 能 插入 其 状态 信息 ， 直 到 该 城市 有 
供应 商 入 驻 。 
删除 异常 ， 如果 我 们 删除 了 特定 城市 的 元 组 ， 就 会 丢失 该 城市 的 状态 信息 。 

更 新 异常 : 如 果 我 们 修改 了 特定 城市 其 中 一 个 元 组 的 状态 信息 ， 而 没有 修改 另 
一 个 ， 就 会 产生 数据 的 不 一 致 性 。 

(那么 如 何 分 解 为 3NF， 避 免 这 种 异常 呢 ? ) 

附加 练习 : 针对 本 章 9.5 节 中 “BCNF” 部 分 的 SNP， 按 照 该 题 的 要 求 进行 
练习 。 

9.6 最 重要 的 函数 依赖 如 下 : 















































2; 

















{ DEPTNO } » { DBUDGET , MGRNO } 
{ MGRNO } ”1{ DEPTNO } 

{ PROJNO } » { PBUDGET , DEPTNO } 
{ EMPNO } —» { PHONENO , PROJNO } 
{ EMPNO , DATE } ”{ JOB , SALARY } 
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{ PHONENO } 一 { OFCNO } 
{ OFCNO } 一 { AREA } 


通过 属性 的 名 称 就 可 以 看 出 其 含义 。 同 时 做 出 的 假设 如 下 : 
口 “ 没 有 一 个 员工 同时 担任 多 个 部 门 的 经 理 ; 
口 没有 一 个 员工 同时 在 多 个 部 门 工 作 ; 
口 ”没有 一 个 员工 同时 担任 多 个 项 目 ; 
口 ， 没 有 一 个 员工 同时 在 多 间 办 公 室 工作 ; 
口 “ 没 有 一 个 员工 同时 有 多 个 电话 号 码 ; 
口 ”没有 一 个 员工 同时 担任 多 份 工 作 ; 
口 ”没有 一 个 项 目 同时 被 分 配给 多 个 部 门 ; 
口 没有 一 间 办 公 室 同时 被 分 配给 多 个 部 门 ; 

部 门 号 、 员 工 号 、 项 目 号 、 办 公 室 号 、 电 话 号 码 都 是 全 球 唯一 的 。 
下 面 给 出 一 种 可 能 的 BCNF 关 系 变量 ! 


DEPT { DEPTNO , DBUDGET , MGRNO } 

KEY { DEPTNO } 

KEY { MGRNO } 

FOREIGN KEY { MGRNO } REFERENCES 

EMP { EMPNO } RENAME { EMPNO AS MGRNO } 











3 






















































































EMP { EMPNO , PROJNO , PHONENO } 
KEY { EMPNO } 
FOREIGN KEY { PROJNO } REFERENCES PROJ 
FOREIGN KEY { PHONENO } REFERENCES PHONE 














SALHIST { EMPNO , DATE , JOB , SALARY } 
KEY { EMPNO , DATE } 
FOREIGN KEY { EMPNO } REFERENCES EMP 


PROJ { PROJNO , PBUDGET, DEPTNO } 
KEY { PROJNO } 
FOREIGN KEY { DEPTNO } REFERENCES DEPT 




















OFC { OFCNO , AREA , DEPTNO } 
KEY { OFCNO } 
FOREIGN KEY { DEPTNO } REFERENCES DEPT 


PHONE { PHONENO , OFCNO } 
KEY { PHONENO } 
FOREIGN KEY { OFCNO } REFERENCES OFFICE 


注意 ， 虽 然 这些 关 系 变量 都 是 BCNEF 的 , 但 它们 仍然 存在 元 余 。 例 如 ,特定 的 












































1 尤其 要 注意 关系 变量 DEPT 中 的 FOREIGN KEY 说 明 。 
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员工 在 特定 的 时 间 会 有 一 份 特 定 的 工作 ， 在 关系 变量 SALHIST 中 就 要 出 现 n 次。 
这 里 的 n 表示 员工 持 有 该 份 工作 时 在 不 同 的 时 间 获 得 的 工资 的 次 数 。 另 外 ，PROJ 
在 PROJNO 和 DEPTNO 上 的 投影 也 一 直 等 价 于 这 些 相 同属 性 对 EMP、PHONE、 
OFC 做 联接 运算 后 进行 的 投影 。 这 就 表明 ， 虽 然 规 范 化 到 BCNF 是 我 们 所 希望 的 ， 
但 它 还 不 足以 消除 元 余 。 




































































部 分 
第 二 


SQL 


第 10 章 


SQL 基本 表 


非 自然 起 点 中 的 自然 顺序 。 


Jane Austen: Persuasion (1818) 

















本 顾 第 1 章 列 出 的 本 书 的 计划 如 下 (至少 第 一 部 分 和 第 三 部 分 ): 
口 ” 首先， 我 想 解 释 一 下 关系 模型 本 身 ， 我 将 采用 设计 过 程 中 使 用 的 语言 
Tutorial D 来 加 以 解释 。 
口 ”然后 ， 我 想 解 释 一 下 关系 模型 中 的 术语 和 概念 ， 主 要 是 采用 SQL 语 言 ,与 
实际 应 用 一 致 的 方式 来 解释 !。( 因 此 , 请 注意 本 书 中 我 没有 尽力 覆盖 到 全 
部 的 SQL， 相 反 ， 只 是 涉及 了 与 关系 相关 的 方面 。 这 在 前 言 中 作为 一 个 主 
要 特点 曾经 提 到 过 。) 
另外 ， 在 第 1 章 中 我 也 声明 过 ， 因 为 是 以 前 制定 的 计划 ， 所 以 本 书 与 大 部 分 的 书 
不 一 样 ， 本 书 只 是 介绍 了 一 些 目 前 在 市 场 上 可 用 的 、 关 系数 据 库 支持 的 概论 性 知识 。 
而 且 ， 本 书 中 大 部 分 章节 也 与 大 部 分 概论 性 书籍 不 同 ， 上 只 是 介绍 了 SQL， 仅 此 而 已 。 
我 相信 ， 先 了 解 关 系 模 型 ， 再 学 习 SQL 要 比 反 过 来 的 过 程 容易 一 些 。 这 么 说 
的 一 部 分 原因 是 按 其 他 方式 来 做 的 话 , 需要 很 多 还 未 了 解 的 知识 (就 像 我 在 前 言 中 
说 的 ， 不 了 解 的 话 就 会 遇 到 很 多 困难 )。 


10.1 发 展 历史 


SQL 语言 最 初 是 由 IBM 研 究 部 在 20 世纪 70 年 代 提 出 的 。 除 了 IBM， 关 于 SQL 的 
第 1 篇 论文 发 表 在 1974 年 5 月 1 日 ~3 日 举办 的 数据 描述 、 访 问 和 控制 会 议 上 ， 



















































































































































































































































































1 SQL 官方 读 为 “ess cue ell”， 但 在 第 1 章 中 我 注释 了 一 下 ， 大 家 经 常 听 到 的 发 音 为 “equel”。 本 书 
中 采用 的 是 官方 读音 ， 因 此 写 为 “an SQL table”( 而 不 是 “a SQL table ”)。 
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作者 为 ACM SIGMOD 工 作 组 的 Donald Chamberlin 和 Raymond Boyce'， 论 文 题目 为 


SEQUEL:A Structured English Ouery La11guage。( 考 虑 到 合法 性 “， 名 字 在 后 面 都 被 
构 化 查询 语言 。 当 然 ， 早 期 名 字 的 “sequel” 发 音 有 时 仍然 会 遇 到 。) 
有 趣 的 是 ，SEQUEL (或 SQL) 是 与 关系 演算 和 《也 许 程度 会 更 浅 ) 关系 代数 存在 
百 来 也 相继 混合 了 二 者 的 一 些 特征 。 





改 为 SQL， 即 结 








明显 的 不 同 ， 昌 然 它 














IBM 研 究 院 首先 实现 了 该 语言 作为 System 有 的 一 个 可 选 的 、 课 程 的 工业 原型 的 
类 在 SQL/DS 和 DB2 中 实现 了 该 语言 ， 它 们 都 不 是 IBM 的 产品 
(它们 都 是 在 20 世纪 80 年 代 常 常 被 使 用 的 )， 大 部 分 是 Oracle 的 产品 〈 首 先 使 用 


接口 。 后 来 IBM 又 相 旨 








在 1979 年 ， 比 











IBM 的 产品 使 用 的 要 早 )。 








发 该 语言 的 标 六 






























































Pt 

















1986 年 ， 美 国 国家 标准 协会 (ANSI) 开 























版 本 , 这 与 IJBM 专 业 用 语 非 常 接近 , 但 有 些 不 正规 , 名 称 为 SQL/86。 





















































在 1987 年 ， 国 际 标准 化 组 织 (ISO) 采用 SQL/86 作为 国际 标准 (ANSI 是 美国 组 的 





























成 员 之 一 )。 后 来 这 个 国际 标准 又 经 过 多 次 演化 , 如 SQL/89、SQL:1992、SQL:1999、 


SQL:2003、SQL:2008 等 等 ， 当 前 了 











用 地 址 : 




















E 在 使 用 的 版 本 是 SQL: 2011。 下 面 是 正式 的 引 








International Organization for Standardization (ISO), Database Laneguage SOL, Document 
ISO/AEC 9075:2011. 
请 注意 : 除非 有 明确 的 声明 ， 和 否则 本 书 中 对 SQL 的 所 有 引用 都 应 该 按照 以 前 





标准 的 版 本 含义 去 理解 。 当 然 ， 你 的 里 程 




































































任何 一 款 商 业 产品 在 整个 生命 周 








是 可 以 变化 的 ， 就 像 他 们 说 的 那样 ， 没 有 















































期 中 支持 这 个 标准 , 然而 同时 每 个 产品 确实 支持 对 





于 特定 产品 很 重要 的 一 些 特征 ， 但 这 根本 不 是 标准 的 一 部 分 。 男 一 方面 ， 因 为 我 限 























也 是 有 理由 的 。 














次 


已 日 





Ll 


第 1 部 分 : 
第 2 部 分 : 
和 3 部 分 : 
4 部 分 : 
9 部 分 : 


RR 波 六 


Rn 





小 小 


值得 一 提 的 是 ， 这 个 官方 标准 
以 下 儿 部 分 组 成 : 

















当然 ， 要 与 标准 相 一 致 。 




















制 了 只 遵循 SQL 的 核心 特征 ， 所 以 希望 在 你 喜欢 的 SQL 产品 中 人 至少 支持 这 些 特征 


























框架 
基础 
CLI 

PSM 
MED 

















is 
lhl 





事实 上 ， 就 是 BCNF 中 的 Boyce (参见 第 9 彰 。 














已 经 变 成 了 大 量 文档 〈 或 者 一 组 文档 )。 首 先 ， 
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2 再 重复 一 下 ，SQL 原来 代表 的 是 “结构 化 查询 语言 ”但 现在 至 少 是 根据 标准 制定 的 ) 它 只 是 











个 名 字 了 ， 不 代表 任何 意义 。 
实际 上 SQL/DS 是 以 System R 中 的 代码 为 基础 的 。 相 反 ，DB2 真 的 是 一 个 完全 重新 实现 的 版 本 。 


ULD 
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fh 
GC 


kr Dk DK Dk 


Hk 

Bd CR CH TA 
让 
> 


: OLB 
: 信息 模式 
: Java 
: XML 

这 里 我 不 想 对 每 个 部 分 进行 详细 讲解 ， 只 想 解 释 一 下 第 2 部 分 ( 它 是 语言 的 核 
心 部 分 )， 该 部 分 大 约 有 1500 页 ， 包 括 几 页 对 于 “可 能 的 问题 ”和 “语言 机 遇 ” 的 
介绍 。 这 个 部 分 留 给 您 去 自行 理解 其 中 事实 和 图 表 的 重要 性 。 


dm dn 


dn 
Lm Lm 
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让 让 
站 冰冰 


DR hi mr YN 
dm 
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10.2 基本 概念 


SQL 中 基本 的 数据 架构 本 身 不 是 关系 型 的 ， 而 是 一 张 SQL 基本 表 ( 带 有 行 和 
列 , 用 来 蔡 代 元 组 和 属性 )。 因 此 , 供应 商 -零件 数据 库 的 SQL 版 由 三 张 表 组 成 。( 注 
意 : 这 里 没有 说 要 采用 术语 表 (table) 来 表示 一 个 SQL 基本 表 ， 除 非 进行 明确 说 
明 。) 基本 的 操作 结构 是 SELECT - FROM -WHERE 表达 式 ， 用 来 从 “ 旧 ” 的 表 产 
生 “ 新 ”的 表 。 例 如 ， 给 出 一 个 规范 的 SQL 查询 ,“ 查 询 状态 值 大 于 10 的 供应 商 
号 和 所 在 城市 信息 ” 形式 如 下 


SELECT SNO ， CITY 
FROM S 
WHERE STATUS > 10 


现在 我 们 来 仔细 分 析 一 下 。 


10.3 表 的 特性 


可 顾 第 2 章 ， 关 系 具 有 如 下 特性 : 
口 “ 不 包含 重复 的 元 组 ; 
口 ”元 组 是 无 序 的 ， 从 上 到 下 排列 ; 
口 ”属性 是 无 序 的 ， 从 左 到 右 排列 ; 
口 ”关系 是 规范 化 的 。 
在 本 书 第 一 部 分 我 们 可 以 从 多 处 看 到 关系 属性 的 重要 性 。 因 此 ，SQL 表 如 何 
来 满足 这 些 特性 呢 ? 答案 是 : 不 太 容易 。 我 们 将 按 次 序 一 一 分 析 。 
关系 中 从 不 包含 重复 的 元 组 : 但 是 SQL 表 中 通常 包含 重复 的 元 组 。 事 实 上 ， 
默认 情况 下 就 是 这 样 的 , 除非 明确 说 明 要 消除 重复 的 元 组 。 因 此 , 你 能 立刻 看 到 SQL 
表 与 关系 不 是 一 回 事 。 
关系 中 元 组 是 无 序 的 ， 从 上 到 下 排列 : SQL 表 中 的 行 同 样 是 无 序 的 ， 从 上 到 
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下 排列 。 所 以 至 少 在 这 一 点 上 ，SQL 和 关系 模型 是 一 致 的 。 

关系 中 属性 是 无 序 的 ， 从 左 到 右 排列 : 但 是 SQL 表 中 的 列 从 左 到 右 是 有 序 的 。 
换 句 话说 ， 与 关系 相反 ，SQL 表 中 会 存在 “第 1 列 ”“ 第 2 列 ” 等 等 。 因此， 在 这 
一 点 上 ，SQL 表 和 关系 是 不 同 的 '。 

关系 总 是 规范 化 的 。 首 先 回 顾 一 下 规范 化 的 定义 ， 是 指 它 属于 INF， 即 关系 中 
的 每 个 元 组 中 每 个 属性 都 恰好 有 一 个 值 ， 再 无 其 他 条 件 。 但 是 SQL 表 的 行 所 对 应 
的 1 列 或 多 列 可 以 不 具有 任何 值 。 在 这 一 点 上 ， 你 又 可 以 发 现 SQL 表 与 关系 是 不 
同 的 。 图 10.1 给 出 了 供应 商 的 SQL 表 ， 其 中 供应 商 S3 就 没有 STATUS 信息 ， 供 
应 商 S5 没有 CITY 信息 。 
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10 Paris 
Paris 
20 London 
30 



































图 10.1 供应 商 S 的 SQL 表 一 一 带 有 空 值 


顺便 提 一 下 ， 昌 然 在 图 10.1 中 用 空白 表示 该 处 没有 数值 ， 但 相应 的 行 在 该 处 
是 没有 空白 的 。 相 反 ， 此 处 不 包含 任何 东西 。SQL 把 这 些 位 置 称 为 “ 空 值 ”。 但 想 
要 清楚 地 解释 SQL 的 空 值 是 很 困难 的 。 如 果 你 真 的 曾经 试图 这 样 做 ， 你 很 快 就 会 
被 扰乱 的 ， 不 可 避免 地 得 出 这 样 一 条 结论 ， 这 是 没有 任何 过 辑 意义 的 。 所 以 ， 我 从 
来 不 试图 做 出 任何 解释 。 因 此 ， 我 采用 下 面 简短 的 方式 来 进行 解释 。 
D SQL 的 空 值 主要 是 用 来 处 理 现 实 世界 中 信息 不 完整 的 问题 〈 这 确实 是 真正 
存在 的 问题 ， 让 我 来 加 速 一 下 寻求 解决 的 答案 )。 例 如 ， 在 现实 世界 中 ， 
我 们 经 常 需要 处 理 这 样 的 事情 “出 现 一 个 不 认识 的 地 址 ””“ 被 通知 到 的 演 
讲 者 ”等 等 ， 这 些 问题 真 的 是 一 些 实际 的 问题 。 然 而 不 幸 的 是 ，SQL 的 空 
值 并 没有 解决 这 些 问题 ,而 且 把 问题 弄 得 更 糟 料 ， 因 为 它们 把 自己 带 入 了 
一 个 另外 的 、 混 乱 的 、 复 杂 的 、 困 难 的 境地 ”。 

口 ”在 任何 情况 下 ，SQL 的 空 值 显然 都 会 破坏 关系 模型 的 规定 ， 只 是 因为 空 值 
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1 实际 上 我 们 可 以 说 ，SQL 表 与 关系 就 不 是 一 回 事 ， 除 非 讨论 的 表 中 只 有 1 列 。 

2 解决 这 个 问题 的 几 种 方法 的 元 长 叙述 请 参见 Database Explorations: Essays on The Third Manifesto 
and Related Topics (2010 年 ，Trafford 出 版 )， 作 者 是 我 和 Hugh Darwen。 简 短 的 讨论 可 以 参见 SOL 
and Relational Theory， 其 中 对 由 SQL 空 值 所 引起 的 一 些 复杂 问题 进行 了 描述 。 
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10.4 修改 表 133 




















不 是 一 个 值 〈 由 定义 可 以 看 出 )， 因 此 具有 空 值 的 SQL 表 会 破坏 信息 原则 
(The Information Principle) :。 注 意 : 实际 上 ， 有 时 SQL 把 空 值 看 作 是 
个 值 ， 有 时 当成 是 一 个 值 。 换 名 话说 ， 这 是 具有 随机 性 的 ， 但 是 大 部 分 情 
况 下 空 值 是 不 被 看 作 是 一 个 值 的 。SQL 频 繁 尝试 按照 它们 的 方式 去 处 理 问 
题 ， 却 显然 说 明了 另 一 方面 的 问题 ， 这 种 语言 存在 深刻 而 严重 的 缺陷 。 
对 此 问题 的 进一步 说 明 已 经 超出 了 本 书 的 范围 ， 讲解 这 些 已 经 足够 了 (就 像 在 
SOL and Relational Theory 一 书 中 的 解释 一 样 )， 因 为 你 从 不 会 相信 来 自 于 具有 空 值 
的 SQL 数据 库 的 答案 。 我 把 这 种 状态 看 作 是 一 种 精彩 的 表演 。 所 以 我 的 建议 是 ， 
不 要 使 用 SQL 的 空 值 ， 也 不 要 使 用 任何 与 它们 相关 的 SQL 特性 (在 本 书 中 ， 我 完 
全 忽略 了 这 一 点 ， 除 非 因为 环境 因素 被 迫 才 顺 便 提 到 它们 )。 
更 多 术语 
如 你 所 知 ， 在 关系 模型 中 把 关系 值 (relations) 和 关系 变量 (relvars) 明显 区 
分 开 。 在 SQL 中 也 必须 要 存在 类 似 的 差别 ， 但 是 相似 的 术语 并 没有 进行 区 分 。 也 
就 是 说 ，SQL 没有 采用 “table value” 和 “table variable” 的 形式 来 区 分 这 些 术语 。 
相反 还 采用 了 相同 的 术语 ， 即 表 (table)( 这 其 实 是 不 太 合 适 的 )， 因 此 ， 必 须要 根 
据 上 下 文 环境 对 这 个 术语 进行 恰当 的 解释 。 
SQL 中 也 没有 与 关系 中 的 表 头 和 表 的 内 容 相 一 致 的 术语 。 实际 上 ， 它 没有 一 个 
恰当 的 表 的 类 型 的 定义 ! ? 


10.4 ”修改 表 


SQL 中 没有 明确 的 表 赋 值 运算 符 ， 但 是 它 有 INSERT、DELETE、UPDATE 语 
句 (没有 D_INSERT、L INSERT 语句 )。 举 个 例子 , 把 下 面 SQL 中 的 部 分 与 Tutorial 
D 对 应 ， 这 个 例子 在 第 2 章 曾 经 给 出 过 (为 了 方便 说 明 ， 我 又 重新 给 出 了 Tutorial 
D 格式 ， 前 面 是 Tutorial D 格式 ， 后 面 是 SQL 格式 : 


INSERT SP RELATION /* Tutorial D */ 
{ TUPLE { “SNO: “S35 yy PNO. MPLY™ .QTY 2507 
TURLE A SNO S537 PNO. P30 OTY. 450. 让 学 
























































































































































































































































































































































































































































重复 的 SQL 表 ， 以 及 按照 从 左 到 右 顺序 排列 的 SQL 表 等 都 会 破坏 信息 原则 ， 这 里 指 的 是 
所 有 的 SQL 表 。( 当 然 包括 一 个 例外 ， 就 是 只 有 一 个 列 的 SQL 表 ， 列 的 顺序 也 就 不 重要 了 )。 
2 这 里 不 要 被 误导 ， 它 调用 “类 型 化 后 的 表 ” 来 处 理事 情 (参见 SOL and Relational Theory， 可 以 看 到 
详细 的 解释 )。 
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INSERT INTO SP ( SNO , PNO , QTY ) 70 
VALUES ('S5' , 'Pl' ，250 ) ， 
(SD TP3Y ; 450°) 3 





DELETE SP WHERE QTY < 150 :， /* Tutorial D */ 
DELETE FROM SP WHERE QTY < 150 }; /* SQL */ 
UPDATE SP WHERE SNO = 'S2' : { QTY := 2 * OTY } ，; /* Tutorial D */ 
UPDATE SP ~ HSQL 

SET OY Se 2 OOTY 

WHERE SNO = 'S2'; 


10.5 等 值 比较 


在 第 1 章 里 我 曾经 提 到 过 ， 与 任何 给 定 类 型 7 有 关联 的 、 所 支持 的 运算 符 必 须 
要 包含 等 值 比较 运算 符 ， 因 为 如 果 没 有 等 值 比较 运算 符 ， 我 们 就 不 能 解释 给 定 的 值 
"是 否 是 特定 集合 $ 的 元素 。 我 也 曾经 讲 过 ， 比 较 v1=-v2 为 真 ， 当 且 仅 当 "1 和 v2 具 
有 相同 的 值 (当然 要 具有 相同 的 类 型 )。 因 此 ， 如 果菜 个 操作 符 Op 满 足 Op(v7) 
了 Op(v2)， 那 么 v1=v2 就 为 FALSE。 那 么 ，SQL 如 何 来 匹配 这 些 需求 呢 ? 
首先 ， 我 们 考虑 当 了 是 表 类 型 的 时 候 如 何 处 理 。 我 们 已 经 看 到 ，SQL 不 支持 
类 型 ， 因 此 ， 更 别 说 要 支持 与 类 型 相关 的 等 值 比较 运算 符 了 。 注 意 : 实际 上 对 于 
这 个 问题 我 们 讨论 的 有 点 多 了 ， 对 “ 表 的 比较 ”部 分 的 进一步 讨论 将 放 在 第 11 
章 进 行 。 

如 果 了 是 标量 类 型 , 会 发 生 什 么 情况 呢 ? 不 幸 的 是 , 情景 是 相当 复杂 的 。 但 是 ， 
我 只 能 给 出 一 个 最 简单 的 概括 总 结 。 首 先 ，SQL 支持 强制 类 型 转换 〈 例 如 隐 式 的 
类 型 转换 ),“=” 就 可 以 赋值 为 TRUE， 即 使 比较 的 是 不 同类 型 的 数据 。 其 次 ， 特 
别 是 字符 串 类 型 , 即使 比较 的 数据 具有 相同 类 型 但 又 明显 存在 不 同时 也 可 能 赋值 为 
TRUE (〈 稍 后 我 会 给 出 一 个 例子 )。 另 外 ， 即 使 比较 的 数据 没有 差别 ,“=” 也 有 可 
能 不 被 赋值 为 TRUE 〈 这 里 针对 的 是 所 有 类 型 ， 但 是 字符 串 类 型 除外 )。 特 别 是 比 
较 的 数据 都 是 空 值 时 会 发 生 这 种 情况 ， 但 不 仅 限 于 此 种 情况 。 此 外 ， 还 有 用 XML 
类 型 定义 的 系统 以 及 用 户 定义 的 类 型 ， 也 根本 没有 定义 “=” 运 算 符 。 

我 们 对 前 面 的 内 容 进 行 简单 说 明 ， 假 设 字 符 串 变量 X 和 Y 的 值 分 别 为 字符 串 
“AB” 和 “AB ”( 注 意 ， 第 二 个 字符 串 后 面 有 一 个 空格 )， 这 两 个 值 是 明显 不 同 
的 ,然后 , 在 某 种 环境 下 , X=Y 也 可 以 为 TRUE, 即使 CHAR_ LENGTH (X) =CHAR_ 























































































































































































































































































































































































































1 我 们 甚至 不 能 讨论 给 定 的 一 个 值 ”是 否 是 类 型 了 的 某 个 值 。 


LENGTH (Y) 不 成 立 。( 显 











10.6 定义 表 135 





然后 者 的 比较 数 长 度 为 3, 前 者 长 度 为 2。) 但 也 要 注意 ， 


即使 X=Y 被 赋值 为 TRUE, X||X=Y||Y 也 不 成 立 '! 我 把 对 这 种 奇特 行为 的 详细 
解释 留 给 你 去 思考 。 以 上 论述 足以 说 明 ， 这 种 结果 很 不 乐观 ， 也 许 超 出 了 你 的 
预期 。 


最 后 ,我 来 说 说 完整 怕 
比较 )。 然 而 ， 
































Relational Theory。 


10.6 ”定义 表 





定义 表 )。 首 先 给 出 表 S 的 定义 


CREATE 


( 


说 明 : 


口 ” 定 义 暗示 了 表 S 是 一 个 基本 表 ( 与 Tutorial D 的 基本 关系 变量 相似 )。 注 
书 的 范围 。 
口 ”定义 中 的 第 2~6 行 说 明 表 中 的 列 以 及 赋予 表 的 完整 性 约束 。 每 一 列 都 有 





TABLE S 
SNO VARCHAR(5) NOT 
SNAME VARCHAR (25) 
STATUS INTEGER NOT 



































E。SQL 确实 支持 行 类 型 的 等 值 比 较 ( 也 支持 其 他 类 型 的 
k 体 的 细节 已 经 超出 了 本 书 的 范围 ， 详 细 解 释 请 参见 SQL and 


















































现在 给 出 表 S、P 和 SP 的 SQL 定义 (在 SQL 中， 采用 CREATE TABLE 语句 











? 如 下 : 


NULL ， 
NOT NULL ， 
NULL ， 


CITY VARCHAR (20) NOT NULL ， 


UNIQUE ( SNO ) ); 





: SQL 也 支持 视图 ， 


















































我 确信 这 也 是 你 期 望 的 ， 但 是 详细 的 说 明 超 出 了 本 
































名 字 、 类 型 ， 但 不 允许 有 空 值 〈 由 于 特殊 说 明了 NOT NULL)。 列 的 类 型 
可 以 是 SQL 允许 的 任何 类 型 。 然 而 ， 要 注意 SQL 不 文 持 与 Tutorial D 的 
CHAR 相似 的 类 型 (参见 第 1 章 )， 所 以 SNO、SNAME、CITY 的 类 型 为 
VARCHAR (可 变 长 度 的 字符 串 )， 即 可 以 任意 定义 长 度 ， 但 要 注意 随 需 
的 最 大 长 度 。 当 然 ， 列 的 说 明 顺序 也 是 很 重要 的 ， 因 为 在 表 中 通常 按照 从 








左 到 右 





强调 : 


口 ”默认 情况 下 ,初始 的 基 
详细 的 说 明 超 出 了 本 
一 定 要 注意 ， 前 面 的 CREATE TABLE 语句 从 风 辑 上 来 说 相当 于 调用 

























































































的 顺序 来 定义 列 。 
D SQL 中 的 UNIQUE (SNO) 相当 于 TutorialD 的 KEY1{SNO}。 









































1 同 相 





本 表 都 是 空 的 〈 也 可 能 说 明 一 个 非 空 的 初始 值 ， 但 














的 范围 )。 











EXLIKEY 也 不 成 立 。 换 名 话说 ， 在 SQL 中 ，v 和 v2 可 以 相等 ， 但 不 能 进行 “like” 运 算 。 
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I 





TABLE 类 型 发 生 器 ， 除 此 之 外 ， 没 有 其 他 作用 (从 语言 逻辑 上 来 说 ， 没 有 规定 的 
次 序 )。 当 你 意识 到 UNIQUE (SNO)( 它 的 作用 是 用 来 定义 完整 性 约束 ) 没有 紧 跟 
在 列 定义 后 面 但 是 可 以 出 现在 任何 地 方 的 时 候 ， 这 个 事实 会 越 来 越 明 显 , 例如 ， 出 
现在 SNO 和 SANME 定义 之 间 。 不 要 在 单独 的 列 定 义 上 提 到 NOT NULL 说 明 , 它 
也 是 用 来 定义 完整 性 约束 。 换 名 话说 ， 我 以 前 也 曾经 提 到 过 ，SQL 不 支持 表 类 型 
发 生 器 ， 它 也 是 根本 没有 给 出 一 个 恰当 的 “ 表 类 型 ”的 定义 。 

下 面 给 出 表 P 和 SP 的 定义 ， 然 后 再 对 其 进行 详细 的 解释 : 


CREATE TABLE P 
( PNO VARCHAR (6) 
PNAME | NOT NULL ， 
COLOR VARCHAR (10) NOT NULL ， 
WEIGHT NUMERIC (5，1) NOT NULL ， 
CITY VARCHAR (20) Nor NULL ， 
UNIQUE ( PNO ) ) :， 
























































































































































NOT NULL ， 








CREATE TABLE SP 

SNO VARCHAR(5) NOT NULL ， 

PNO VARCHAR(6) NOT NULL ， 

QTY INTEGER } NOT NULL ， 

UNIQUE ( SNO , PNO ) ， 

FOREIGN KEY ( SNO ) REFERENCES S ( SNO ) ， 
FOREIGN KEY ( PNO ) REFERENCES P ( PNO ) ) 


“ 表 标 识 符 39 
SQL 没有 使 用 术语 “ 表 标 识 符 ”(table litera1)， 但 它 支 持 该 结构 ，VALUES 表 
达 式 提供 了 与 其 同样 的 功能 ， 例 如 : 
































VALUES ("SL Smitlhi “320. , ‘LOnNndon™ JJ 7 
(S22 Jones' y 10 Baries,. }) y 
(VS3T .TBlake y '30°"% Paris™ }) 4 
(Sd TOLark, wm “20.% LOndeonn)”y 
('S5' , 'Adams' , 30 ,， 'Athens' ) 








(事实 上 ,我们 以 前 在 “修改 表 ” 部 分 的 INSERT 例子 中 见 到 过 VALUES 表达 
式 的 例子 。) 

顺便 提 一 下 , 要 注意 前 面 VALUES 表达 式 的 定义 要 依赖 于 列 中 从 左 到 右 的 顺 
序 。 也 要 注意 ， 真 正 的 表 标 识 符 应 该 被 授权 允许 出 现在 表 的 表达 式 允 许 出 现 的 任 
何 地 方 ， 但 是 SQL 中 允许 表 的 表达 式 可 以 在 多 处 使 用 ， 但 是 VALUES 表达 式 却 
不 允许 参见 第 14 章 练 习 )。 这 就 是 我 说 这 个 表达 式 只 提供 了 部 分 表 标识 符 功能 
的 原因 。 
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10.7 SQL 系统 与 程序 系统 
我 们 再 来 回顾 一 下 第 1 章 图 1.3 的 代码 片段 ， 用 它 来 说 明 程序 系统 中 各 种 熟悉 


的 概念 : 语句 、 类 型 、 


来 回 
































项 一 下 与 数据 库 直接 相 





变量 、 由 





上 关 的 所 有 概念 , 看 看 这 些 与 SQL 的 说 明 到 底 相差 多 远 。 









































\ 值 、 标 识 符 、 只 读 运算 符 ( 包 括 比较 运算 符 )。 再 















































口 SQL 语句 : 我 们 已 经 看 到 了 SQL 中 存在 INSERT、DELETE、UPDATE 语 
句 ， 也 存在 CREATE TABLE 语句 。 
口 ”SQL 类 型 : 我 们 已 经 看 到 各 种 COLUMN 的 类 型 ， 如 : VARCHAR (n)、 
INTEGER、NUMBERIC (p,q),， 我 也 简要 地 提 到 了 一 些 其 他 类 型 ， 包括 
用 户 定义 的 类 型 。 不 幸 
口 ” 表 变量 : SQL 中 存在 表 变 量 的 定义 ， 但 没有 使 用 此 术语 。 

口 “ 表 赋值 : 支持 INSERT、DELETE、UPDATE 语句 ， 但 不 支持 表 赋 值 本 身 。 
口 ” 表 的 标识 符 ， 参见 前 面部 分 中 对 于 VALUES 表达 式 的 讨论 。 注 意 : 我 们 

















的 是 ， 我 们 也 看 到 在 SQL 中 表 本 身 没有 类 型 。 





















































也 看 到 一 些 标量 标识 符 的 例子 (例如 ，‘S1”"，‘Smith*，20，‘Londonm’ )， 我 














们 还 看 到 了 一 些 行 标 识 符 的 例子 ， 即 带 有 括号 的 表达 式 《‘S1’，“Smith”， 
20，‘London’ )。 



































表 
的 值 就 是 这 样 的 值 。 该 
表 


算 符 : 虽然 


的 只 读 运 算 


的 值 : SQL 中 存在 该 定义 ， 但 没有 这 个 术语 。 在 特定 时 间 S、P 和 SP 





























值 也 可 以 用 VALUES 表达 式 来 说 明 。 


























见 第 11 章 和 第 12 章 ) 
STATUS>10 就 是 一 个 例子 ， 该 例子 位 于 “基本 概念 ”部 分 ， 采 用 SQL 的 


语法 来 说 明 。 





D。 表 的 比较 运算 符 ， 虽 然 以 前 提 到 过 〈 参 见 “ 等 值 比较 ”部 分 )， 但 仍 将 在 
第 11 章 详细 讨论 。 





10.8 ”练习 


下 面 哪个 说 法 是 正确 的 ? 
10.1 SQL 表 中 的 行 没 有 顺 
10.2 SQL 表 中 的 列 没有 顺 
10.3 SQL 表 中 不 存在 没有 命名 的 列 。 

10.4 SQL 表 中 不 存在 两 个 或 两 个 以 上 同名 的 列 。 
10.5 SQL 表 中 不 包含 重复 的 行 。 





























我 们 已 经 看 到 了 一 个 例子 ， 但 仍 需要 详细 讨论 〈 参 
。 表 达 式 SELECT SNO, CITY FROM S WHERE 









































了 了。 


了 了。 
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10.6 SQL 表 总 是 INF 的 。 

10.7 SQL 表 中 列 定义 可 以 是 任意 复杂 的 。 
10.8 SQL 表 本 身 有 类 型 。 
10.9 SQL 表 具 有 指针 类 型 的 列 。 














10.9 “答案 


在 给 出 详细 的 答案 之 前 ， 我 想 提醒 您 注意 一 下 前 面 提 到 的 两 点 事实 ， 即 SQL 
和 关系 模型 是 一 致 的 。 我 想 让 你 从 这 种 状态 中 得 出 自己 的 结论 。 
10.1 SQL 表 中 的 行 没 有 顺序 。 正 确 
10.2 SQL 表 中 的 列 没有 顺序 。 错 误 
10.3 SQL 表 中 不 存在 没有 命名 的 列 。 错 误 
在 基本 表 中 不 存在 任何 没有 命名 的 列 , 这 是 正确 的 (偶尔 视图 也 会 出 现 这 种 情 
况 )。 然 而 不 率 的 是 ， 特 定 的 表 的 表达 式 在 实际 中 真 的 会 产生 没有 名 字 的 列 。 下 面 
给 出 一 个 此 种 表达 式 的 小 例子 以 及 对 应 的 表 中 数据 ， 如 图 10.2 所 示 (当然 ， 与 我 
们 通用 的 例子 相似 )。 


SELECT ENO , 2 * WEIGHT 
FROM P 


注意 ; 这 个 问题 按照 标准 来 说 ， 没 有 名 字 的 结果 列 应 该 有 DBMS 来 假定 给 出 
一 个 名 字 ， 而 且 要 与 表 中 的 名 字 有 所 区 别 ， 是 没有 定义 过 的 。 但 是 ， 只 存在 于 部 分 
标准 中 的 这 项 规则 也 只 是 一 种 迟到 的 企图 来 修改 已 经 被 破坏 的 情况 (实际 上 从 一 开 
台 就 已 经 被 破坏 了 )。 同 时 ， 也 要 注意 到 未 定义 的 名 字 会 随 着 数据 库 的 变化 而 变化 。 
而 且 ， 发 现任 意 给 定 情况 下 的 名 字 是 一 件 非常 不 重要 的 事情 。 因 此 ， 实 际 上 ， 不 用 
去 计较 问题 中 的 列 是 否 有 名 字 。 

10.4 SQL 表 中 不 存在 两 个 或 两 个 以 上 同名 的 列 。 错 误 

对 于 基本 表 来 说 不 存在 同名 的 列 ( 视 图 也 是 如 此 )， 但 是 特定 的 表 的 表达 式 却 
可 以 产生 同名 的 两 列 或 多 列 ( 甚 至 具有 同一 类 型 )。 下 面 给 出 一 个 小 例子 以 及 表 中 
的 数据 ， 如 图 10.3 所 示 。 


SELECT PNO ,PNO 
FROM P 


注意 : 更 常见 的 接近 于 现实 的 例子 如 下 。 


SELECT * 
FROM S , P 


这 个 例子 给 出 了 有 具有 两 个 CITY 列 的 表 ， 详 细 讨 论 请 参见 第 11 章 。 
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图 10.2 没有 列 名 字 的 表 图 10.3 同名 的 列 












































10.5 SQL 表 中 不 包含 重复 的 行 。 错 误 。 

同样 ， 在 基本 表 中 这 个 论断 是 正确 的 ，UNIQUE 说 明 可 以 阻止 出 现 重 复 的 列 ， 
晶 是 这 个 说 明 是 可 选 的 。 详 细 讨 论 请 参见 第 11 章 。 

10.6 SQL 表 总 是 INE 的 。 错 误 

只 有 表示 关系 的 表 才 能 说 成 是 INF 的 ， 但 是 SQL 不 总 是 这 样 。 注 意 ; 只 有 基 
本 的 情况 下 才 满 足 这 个 论断 ， 因 为 NOT NULL 说 明 至 少 可 以 保证 每 一 行 每 一 列 都 
有 值 〈 而 且 是 对 应 类 型 的 值 )， 但 是 这 个 说 明 是 可 选 的 。 而 且 ， 特 定 的 某 种 表 的 表 
达 式 也 可 以 产生 带 有 空 值 的 结果 ， 即 使 输入 的 时 候 没 有 空 值 (参见 第 12 章 给 出 的 
一 个 例子 )。 而 且 ， 在 任何 情况 下 ， 在 商业 数据 库 中 ， 列 的 顺序 都 是 从 左 到 右 的 ， 
也 不 会 提 到 未 命名 列 的 可 能 性 以 及 重复 列 的 可 能 4 

10.7 SQL 表 中 列 定义 可 以 是 任意 复杂 的 。 正 胡 

10.8 SQL 表 本 身 有 类 型 。 错误 

10.9 SQL 表 具 有 指针 类 型 的 列 。 正 确 

在 本 章 中 我 没有 讨论 这 个 问题 。 但 是 令 人 难过 的 是 ，SQL 表 中 真 的 允许 某 一 
列 的 值 采 用 指针 方式 来 指向 某 个 目标 表 中 的 行 。 指 针 被 称 为 引用 值 (reference 
values)，3 引 用 该 值 的 列 类 型 为 REF type。 坦 率 地 说 ，SQL 表 中 包含 这 些 特征 的 原 
因 还 没有 完全 弄 清 楚 。 但 可 以 肯定 的 是 , 这 些 特征 的 有 无 似乎 对 于 实现 一 些 有 用 的 
功能 没有 多 大 影响 。 所 以 ， 虽 然 包含 了 这 些 特征 ， 但 不 要 使 用 它们 ! 
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第 11 章 


SQL 操作 符 | 


你 知道 我 的 方法 ， 并 使 用 它们 。 
一 一 Arthur Conan Doyle: The iem of Four (1890) 








现在 我 们 开始 来 论证 SQL 是 如 何 来 支持 关系 代数 中 各 种 操作 符 的 ， 或 者 文 持 
到 什么 程度 ?由 于 各 种 各 样 的 原因 , 本 章 结 构 故 意 采用 与 本 书 第 一 部 分 第 4 章平 行 
的 结构 。 然 而 ， 首 先 ， 要 提醒 你 一 下 : 
D SQL 表 中 存在 重复 的 行 , 所 以 发 现 这 种 情况 的 时 候 你 就 要 想 办 法 消除 (至 
少 要 把 问题 中 的 表 按 照 关系 型 操作 来 处 理 )。 
口 SQL 表 按 照 从 左 到 右 的 顺序 排列 属性 , 但 是 写 代 码 时 可 以 不 依赖 于 这 种 次 
序 ， 因 为 代码 不 是 关系 型 的 。 
D SQL 表 中 可 以 包含 空 值 ， 但 是 不 允许 出 现 。 
注意 : 在 SOL and Relational Theory 一 书 中 描述 了 称 为 “从 关系 型 角度 使 用 
SQL ”的 规则 ， 因 此 如 果 你 遵守 那 本 书 中 的 推荐 规则 ， 那 么 你 的 所 有 处 理 行为 几乎 
都 证 明 SQL 好 像 真 的 是 关系 型 的 ， 而 且 你 会 体会 到 真正 的 关系 型 系统 (或 至 少 是 
接近 于 关系 型 的 ) 给 你 带 来 的 好 处 。 



























































~ 















































11.1 限制 


本 章 中 大 部 分 时 间 我 计划 使 用 与 第 4 章 同样 的 例子 ,所 以 下 面 的 这 个 查询 就 是 
和 4 章 用 来 介绍 显示 运算 符 的 查询 ， 即 查询 1:“ 查 询 零 件 重量 小 于 12.5 磅 的 零件 
言 息 ”为 了 进行 比较 ， 我 首先 重复 描述 一 下 Tutorial D 的 格式 : 

P WHERE WEIGHT < 12.5 


SQL 查询 的 格式 如 下 : 






































SY 
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SELECT PNO , PNAME , COLOR , WEIGHT , CITY 


FROM PP 
WHERE WEIGHT < 12.5 
说 明 : 








口 与 TutorialD 不 同 ,SQL 文 持 使 用 〈.) 作为 引用 符号 ， 称 为 域 操 作 符 (dot 
qualified references)。 实 际 上 ， 上 面 给 出 的 表达 式 只 是 一 种 简写 形式 ( 注 
意 下 面 SELECT 和 WHERE 子 句 中 的 〈.) 引用 符号 )。 


SELECT 了 .PNO ; P.PNAME 7 P.COLOR , P.WEIGHT ; P.CITY 
FROM BB 
WHERE P.WEIGHT < 12.5 


上 面 的 查询 中 把 能 够 使 用 域 操作 符 的 地 方 都 尽量 使 用 了 该 操作 符 。 
口 ”SQL 也 支持 其 他 的 简写 形式 ， 例 如 : 


SELECT ‘Pa* 
FROM 
WHERE P.WEIGHT < 12.5 


SELECT 子 句 中 的 表达 式 “P.*” 表 示 列 出 了 P 中 所 有 的 列 ， 采 用 逗号 来 进行 
分 隔 ， 顺 序 为 从 左 到 右 。 然 而 ， 正 是 因为 要 依赖 于 从 左 到 右 的 顺序 ， 这 种 表示 法 就 
给 粗心 的 人 带 来 很 多 陷阱 ， 所 以 在 本 书 中 我 没有 采用 这 种 表示 。 如 果 使 用 的 话 ， 就 
会 进行 特殊 说 明 。 同 时 还 要 注意 ， 域 操作 符 〈.) 是 可 选 的 ， 也 就 是 说 ， 可 以 采用 
“SELECT *” 代 替 “SELECT P.*”。 

口 ” 同 TutorialD 一 样 , SQL 也 允许 在 WHERE 子 句 中 使 用 布尔 表达 式 来 表示 

些 简单 的 限制 条 件 ， 后 面 我 们 会 看 到 一 些 例子 。 










































































































































































11.2 投影 


请 看 下 面 的 查询 ， 查 询 2:“ 查 询 每 个 零件 的 编号 、 颜 色 和 所 在 城市 ”。 同 样 我 首 
先 采 用 第 4 章 TutorialD 的 格式 来 表示 这 个 查询 , 然后 采用 SQL 格式 表示 , 具体 如 下 : 


Pt PNO.y. COLOR. ;CITY. 才 







































































SELECT PNO , COLOR , CITY 
FRO. P 


注意 : SQL 中 不 具有 TutorialD 的 ALL BUT 特性 。 
现在 我 们 讲解 相当 重要 的 一 点 ， 即 第 4 章 4.3 节 投 影 部 分 第 2 个 例子 的 查询 ， 
查询 3:“ 查 询 当前 存在 的 零件 颜色 和 城市 ” 首先 给 出 Tutorial D 格式 : 


有 DTDORT ARC 下 下 省 















































SQL 的 语法 格式 如 下 : 


SELECT 


ERO 








COLOR ， CITY 


已 


查询 结果 如 图 11.1 所 示 。 
如 你 所 见 ， 这 个 结果 不 是 一 个 关系 ， 它 包含 了 重复 的 元 组 ， 因 此 不 能 满足 任何 码 的 


约束 《注意 观察 图 中 没有 双 下 划 线 的 标志 )。 换 句 话说， 与 关系 模型 的 投影 操作 不 同 ， 





























11.3 并 、 交 、 差 14 
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SQL 的 SELECT 表达 式 不 能 消除 重复 ， 除 非 进 行 显 式 说 明 要 求 消 除 重复 。 消 除 重复 的 
方式 为 采用 关键 词 DISTINCT, 将 其 放 在 SELECT 子 句 的 逗号 列表 之 前 , 具体 格式 如 下 : 











口 


HW 





三 











区 








T DISTINCT COLOR ， CITY 


Pp 





果 如 图 11.2 所 示 。 


百 林 


London 
London 


London 
paris 
Oslo 
paris 




















11.1 查询 3 的 运行 结果 

















影响 (为 什么 ?) 
关系 型 的 处 到 


在 多 


人 





和 投影 的 例子 。 碍 询 4: 
在 城市 ” 下 面 给 出 


AN 



























































图 11.2 ”查询 3 消除 重 


出 
省 
本 
i 
一 
al 
垢 
酒 






















































































分 给 出 的 SELECT 表达 式 基本 相似 ); 


ELECT DISTINCT PNO ,; COLOR ， 
ROM 


P 


HERE WEIGHT < 12.5 


11.3 并 、 交 、 郑 


考虑 如 下 的 查询 ， 查 询 35:“ 碍 询 至 少 存在 一 位 供应 商 或 者 至 少 提供 一 种 零 们 
的 城市 信息 ” Tutorial D 的 格式 如 下 : 





/* DISTINCT 可 以 省 略 */ 








司 包 特 性 ， 给 出 了 一 个 同时 包含 了 限制 
“查询 零件 重量 小 于 12.5 磅 的 零件 号 、 颜 色 和 所 
SQL 的 语法 格式 (与 第 10 章 10.2 节 “ 基 本 概念 ”部 


FP 采用 DISTINCT 说 明 并 不 是 不 正确 , 但 是 它 不 会 有 任何 
。 通 常情 况 下 ， 省 略 DISTINCT 意味 着 你 在 进行 一 些 非 
EE， 因此 我 要 说 :不 能 这 样 做 。 

入 4 章 中 ， 为 了 说 明 关 系 代数 的 


I 
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St CTY UNIEON. 


SQL 的 格式 同 它 类 


SELECT 
UNION 
SELECT 


p { CITY 
以 : 


CITY FROM 5S 





Pp 


CE 


奇怪 的 是 ， 使 用 UN 


TY FROM 














} 

















ION 后 和 投影 不 同 )“，SQL 确 实 


ea 


通 











过 默认 的 方式 消除 了 








重复 ， 但 通过 DISTINCT 进 行 显示 说 明 也 不 是 错误 的 ， 例 如 : 




















































































































































































































































































































SELECT CITY FROM S 

UNION DISTINCT 

SETECT CITYE, ERGM. RE 

你 甚至 可 以 这 样 写 : 

DLEGCT' DISTINGT. CIEY. FROM.S 

UNION DISTINGT 

SBLECT. DISTINCGT CITY FROM PP 

回顾 关系 模型 ，UNION 的 操作 数 必 须 是 同一 种 类 型 的 (例如 ， 具 有 同样 的 标 
题 )， 结 果 也 是 和 操作 数 具 有 同样 类 型 。 然 而 ，SQL 表 是 没有 类 型 的 ， 所 以 不 可 能 
采用 这 个 简单 的 规则 ， 也 确实 是 不 能 采用 。 事 实 上 ， 关 于 UNION 运算 的 操作 数 和 
运行 结果 的 SQL 规则 是 相当 复杂 的 ， 复杂 到 不 能 在 这 里 给 出 详细 解释 的 程度 。( 当 
然 ， 如 此 复杂 的 原因 就 是 因为 SQL 没有 表 类 型 的 定义 。) 不 管 怎样 ， 目 前 也 可 以 说 ， 
只 要 在 UNION 或 UNION DISTINCT 后 面 使 用 可 选 的 关键 字 CORRESPONDING 进行 
说 明 ，SQL 规则 就 几乎 退化 为 关系 规则 。 更 准确 地 说 ， 如 果 表 刀 和 巡 同时 具有 列 
名 为 C1，C2，…，Cm 的 列 〈 而 且 仅 有 这 些 列 )， 如 果 列 嫌 的 列 Ci 和 2 的 列 Ci 
具有 同 种 类 型 (i=1, 2 “°° n), 则 表达 式 如 下 : 

SELEGT GL 3 C2 sa yO RRO 去 子 

UNION [ DISTINCT ] CORRESPONDING 

SEEECE CI "CZ mee yp OH ERG t2 

该 表达 式 将 产生 没有 重复 行 的 表 ， 而 且 列 的 名 字 和 类 型 与 17 和 2 相同 。 实 际 上 ， 
只 要 使 用 CORRESPONDING 进 行 说 明 ， 在 表达 式 的 两 个 SECLECT 子 句 逗 号 列表 中 
就 不 需要 按照 从 左 到 右 的 顺序 说 明 各 列 “。 但 是 如 果 你 省 略 了 CORRESPONDING， 














1 阐明 一 下 这 个 观点 : 在 结果 中 不 存在 任 














何 重复 的 行 ， 即 使 在 两 个 操作 数 表 中 存在 相同 的 行 ， 或 者 在 





任 一 表 中 存在 相同 的 行 。 
就 像 这 段 论述 中 建议 的 (有 些 
下 











2 








不 太 光 明正 大 )， 如 果 不 采 


























个 SELECT 子 句 的 列 名 逗号 列表 中 

















然而 要 注意 的 是 ,即使 你 使 

















用 CORRESPONDING 说 明 ， 那么 当 且 仅 当 
具有 相同 的 从 左 到 右 的 顺序 时 ， 这 些 列 才能 被 认为 是 一 致 的 。 
j CORRESPONDING 说 明 , 结果 中 列 的 从 左 到 右 顺序 也 是 按照 两 个 逗 
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则 所 处 理 的 就 不 是 关系 型 的 ， 所 以 我 再 次 强调 一 下 : 不 要 省 略 。 
至 于 交 运 算 (INTERSECT) 和 差 运 算 (EXCEPT)， 以 上 针对 并 运算 讨论 的 内 
容 完全 适用 于 二 者 ， 因 此 ， 这 里 就 不 再 举例 说 明 。 
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顾 第 4 章 关系 型 的 并 操作 符 拥 有 的 一 些 重要 的 规范 特性 : (1 ) 交换 性 (rl UNION 
12 与 2 UNION rl 等 价 ); (2) 结 合 性 (rl UNIONr2 UNIONr3) 与 (rl UNIONr2) UNION 
73 等 价 ); (3) 自 反 性 (x UNIONr 简写 为 r)。 这 些 特性 同样 适用 于 关系 型 的 交 运 算 符 。 
但 是 SQL 与 之 类 似 的 操作 符 通常 不 具有 交换 型 〈 这 是 由 于 固定 了 从 左 到 右 的 次 序 )， 
也 不 具有 自 反 性 〈 这 是 由 于 存在 重复 的 行 )。 然 而 ， 它 们 具有 结合 性 。 


11.4 更 名 


在 第 4 章 里 ， 使 用 下 面 的 查询 解释 RENAME， 即 “查询 至 少 一 个 供应 商 的 名 
字 或 者 至 少 一 个 零件 的 名 字 ， 并 用 name 显示 。”( 就 像 我 在 那 一 章 曾经 说 过 的 ， 这 
个 例子 是 人 造 的 , 不 是 一 个 很 自然 的 查询 ,但 是 它 足 以 能 够 说 明 我 要 表达 的 观点 。) 
Tutorial D 的 格式 如 下 : 


( (SS RENAME { SNAME AS NAME } ) { NAME } ) 
UNION 
( ( P RENAME { PNAME AS NAME } ) { NAME } ) 


SQL 的 语法 格式 如 下 : 
SELECT SNAME AS NAME FROM S 


UNION CORRESPONDING 
SELECT PNAME AS NAME FROM P 


如 你 所 见 ，SQL 实际 上 支持 RENAME 操作 符 , 在 SELECT 子 名 的 去 号 列表 中 
采用 AS 来 加 以 说 明 。 注 意 ， 在 这 个 例子 中 我 省 略 了 CORRESPONDING 关键 词 ， 
这 是 因为 表 中 只 有 一 列 ， 但 是 使 用 它 也 不 是 错误 的 。 





























































































































































































































11.5 练习 I 
11.1 写 出 下 列 查询 的 SQL 表达 式 : 











号 列表 中 的 一 个 列表 的 列 顺序 显示 的 。 换 句 话 说 ， 我 们 不 能 完全 脱离 SQL 列 的 从 左 到 右 的 顺序 属 
性 ， 但 是 写 代码 时 不 能 依赖 于 它 ! 
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但 如 
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. 查询 所 有 的 供应 关系 。 
. 查询 供应 商 S2 提供 的 零件 号 码 。 

































































. 查询 由 巴黎 的 所 有 供应 商 供应 的 零件 号 码 。 
































11.2 请 根据 自己 的 情 























a 
b 
c. 查询 状态 值 在 15 和 25 之 间 的 供应 商 ， 消 除 重复 值 。 
d. 查询 状态 值 低 于 供应 商 S2 的 状态 值 的 供应 商号 码 。 
@ 





况 写 出 一 些 SQL 碍 询 表达 式 。 最 好 利用 自己 的 数据 库 ， 























果 没 有 ， 也 可 以 根据 供应 商 -零件 数据 库 来 构造 查 询 。 





11.6 答案 I 


一 点 ，SQL 与 Tutorial DD 一 术 





11.1 在 第 4 章 的 练习 

















4.7 中 给 出 了 这 些 查询 的 Tutorial D 表达 式 。 
a. SELECT SNO , PNO , QOTY 





ELECT DISTINCT PNO 


FROM SP 
b. S 
FRO SP 
WHERE SNO = 'S2' 























注意 : 这 里 不 需要 使 用 DISTINCT， 为 什么 ? 
C。 SELECT SNO , SNAME , STATUS , CITY 





FROM S 








WHERE STATUS >= 15 AND STATUS <= 25 


d. SELECT SNO 
FRO S 








WHERE STATUS < 
( SELECT STATUS 


ERO 





S 


WHERE SNO = 'S2' ) 


与 第 4 章 的 表达 式 一 样 ， 这 个 答案 需要 进一步 解释 。 首 先 ,我 们 已 经 说 明了 这 









































# ，WHERE 子 名 中 的 布尔 表达 式 通 常 要 比 简单 的 约束 条 








件 复杂 得 多 。 其 次 ， 跟 在 “<” 符 号 之 后 的 子 表达 式 〈 由 封装 在 括号 中 的 
SELECTFROM-WHERE 表 达 式 组 成 ) 是 SQL 子 查询 !。 至 少 从 概念 上 来 讲 ， 首 先 
子 查 询 的 值 ， 返 回 如 下 形式 的 带 有 一 行 和 一 列 的 表 


计算 











1 顺便 说 一 句 , 可 以 把 一 个 SELECT-FROM-WHERE 表达 式 髓 套 帮 


达 


全 


中 


2 图 











式 里 (当然 ， 可 以 垦 套 任意 


青 合理 的 。 


























FP 缺少 双 下 划 线 ， 这 并 不 是 



































( 见 区 

















11.3 )。 


E 另 一 个 SELECTFROM-WHERE 表 
层次 )， 在 SQL (或 者 SEQUEL) 语言 的 最 初 名 字 中 出 现 结构 化 也 是 





居 误 。 详 细 讨论 请 参见 《SOL and Relational Theory》。 


Ee 
CN 
啼 
站 
Ee 
pk 
心 
六 








图 11.3” 带 有 一 行 一 列 的 表 


现在 发 生 了 双重 的 强制 转换 (例如 ， 隐 式 的 类 型 转换 )。 表 被 强制 转换 为 包含 
一 行 的 表 ， 反 过 来 这 一 行 又 被 强制 转换 为 单 标量 值 。( 相 反 ，Tutorial D 需要 显 式 
说 明 这 些 类 型 转换 ， 这 一 点 你 可 能 回忆 起 来 了 。) 标量 值 然 后 被 插入 到 原来 的 查询 
里 ， 获 得 如 下 查询: 


SELECT SNO 
FROM S 
WHERE STATUS < 10 


进而 可 以 获得 所 希望 的 全 部 结果 。 
但 是 ， 有 时 也 会 发 生 一 些 例外 ， 下 面 讨论 几 种 情况 。 首 先 给 出 一 个 初始 的 表达 
式 ， 但 是 这 次 采用 显 式 的 域 (.) 运算 符 来 说 明 。 
SELECT S.SNO 
FROM S 
WHERE S.STATUS < 
( SELECT S.STATUS 


FROM S 
WHERE S.SNO = 'S2" ) 


我 希望 大 家 弄 清 楚 ， 上 面 表达 式 中 第 1 行 和 第 6 行 对 于 “S.SNO” 的 两 次 列 引 
用 表达 的 不 是 同一 个 意思 ， 同 样 ， 在 第 3 行 和 第 4 行 对 于 “S.STATUS” 的 两 次 列 
引用 也 是 如 此 。 事 实 上 ，SQL 遵 循 块 引用 规则 ， 虽 然 这 些 引用 规则 相当 复杂 ， 也 超 
出 了 本 书 的 预期 。 然 而 ,我们 可 以 在 FROM 子 句 中 使 用 AS 说 明 的 形式 来 清晰 地 表示 
这 种 规则 ， 同 样 可 以 采用 域 .) 运算 符 来 说 明 1: 


SELECT X.SNO 
ERO S AS 又 
WHERE X.STATUS < 
( SELECT Y.STATUS 
FROM S AS Y 
WHERE Y.SNO = 'S2' ) 


上 述 修正 格式 中 的 符号 X 和 Y 就 是 一 种 域 变量 (range variable)， 它 们 是 变量 
(从 逻辑 上 来 说 ,与 编程 语言 中 的 变量 不 同 )， 作 用 范围 为 表 S， 在 整个 表达 式 求 值 
时 某 个 给 定 的 时 间 点 ， 它 们 表示 了 表 中 的 某 些 行 (当然 表 示 的 不 是 相同 的 行 )。 而 
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1 注意 ， 以 前 讨论 的 AS 子 句 〈 在 列 的 更 名 部 分 ) 出 现在 了 SELECT 子 句 中 ， 而 不 是 FROM 子 句 中 。 
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附录 D) 具有 的 一 种 特征 ， 而 关系 运算 当然 以 关系 代数 为 


e。 SELECT PNO 











FROM 下 
WHERE NOT EXISTS 
( SELECT * 
FROM S 
WHERE CITY = 'Paris' 
AND NOT EXISTS 
(‘SELEECT 尖 
FROM SP 
WHERE S.SNO = SP.SNO 
AND SP.PNO = P;PNO ) ) 3; 


在 Tutorial D 中 不 需要 使 用 这 种 结构 。 实 际 上 ， 域 变量 是 关系 运算 〈 人 参 员 











基础 。 

















这 个 练习 (实际 上 与 第 4 章 的 有 些 相似 ) 放 在 这 里 有 些 不 公平 ， 因 为 我 认为 不 
能 只 用 本 书 中 这 一 部 分 讨论 的 内 容 来 回答 这 个 问题 ,然而 我 来 简短 地 解释 一 下 , (a) 
SQL 表达 式 的 EXISTS 子 查询 的 结果 为 真 , 当 且 仅 当 由 子 查 询 说 明 的 表 中 至 少 包含 1 



















































































行 ';(b) 整个 表达 式 的 两 个 子 查询 的 变量 是 有 相关 性 的 〈《 即 相关 子 查询 )， 这 意味 
着 它们 包含 了 对 于 外 层 表达 式 中 所 定义 条 目的 引用 ; (c) 我 以 前 提 过 的 与 使 用 
“SELECT” 有 关 的 问题 没有 出 现在 EXISTS 表 达 式 中 ， 所 以 在 这 种 环境 下 ， 使 用 该 





























结构 是 很 安全 的 。( 顺 便 说 一 下 ， 在 SELECT 子 句 的 子 查询 中 省 略 DISTINCT 也 是 安 














全 的 ， 这 个 子 查询 表示 了 调用 EXISTS 的 变量 ， 准 确 地 说 ， 
11.2 答案 略 








11.7 联接 
SQL 有 多 种 不 同 的 方法 或 方式 来 表示 联接 操作 。 同 村 

















这 是 为 什么 呢 ? ) 


FE， 使 用 第 4 章 的 联接 查 


询 ， 即 “对 于 每 一 个 供应 关系 ,查询 其 零件 号 码 、 数 量 和 相应 供应 商 的 详细 信息 ”。 








Tutorial D 格式 如 下 : 


SP JOIN S 


我 想 要 讨论 的 第 一 种 SQL 格式 与 Tutorial D 的 格式 非常 相似 : 





SELECT * FROM SP NATURAL JOIN S 


强调 : 
口 “这 种 形式 依赖 于 在 两 个 操作 表 中 具有 同样 名 称 和 用 




















I 类 型 的 列 上 进行 联接 运 














算 来 完成 (TutorialD 也 是 如 此 )。 我 强烈 推荐 采 














这 种 形式 来 实现 联接 运 




















1 SQL 的 EXISTS 运算 符 与 关系 运算 中 的 EXISTS 等 同 。 
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算 ， 其 原因 在 SOL and Relational Theory 中 有 详细 讲解 。 

















口 “ 整 个 表达 式 产生 的 结果 列 如 下 : SNO -PNO -QTY -SNAME -STATUS - 








CITY (在 SQL 中 总 是 按照 从 左 到 右 的 顺序 来 写 )。 通 常情 况 下 ，SELECT * 
FROM 1 NATURAL JOIN 22 的 结果 列 中 第 一 位 是 联接 的 列 ， 然 后 按照 次 
序 依 次 为 的 列 ，z2 的 列 1。 


























口 ”当然 ， 同 样 要 避免 使 用 “SELECT *” 在 本 章 中 的 前 面部 分 也 曾 解释 过 。 




















这 里 使 用 它 的 主要 目的 是 可 以 看 见 森 林 中 的 树木 , 即将 注意 力 集中 在 这 部 
分 的 核心 主题 上 ， 也 就 是 联接 运算 。 相 反 ， 推 荐 使 用 的 格式 如 下 : 





















































SELECT SNO , PNO , QTY 7 SNAME , SIATUS , CIIY 
FROM SP NATURAL JOIN S 


但 这 个 联接 运算 本 身 会 有 一 些 损失 〈 即 使 在 单独 的 行 上 来 写 出 SELECT 和 
FROM 子 句 )。 


11.7.1 “ 另 一 种 格式 


分 原 
法 ， 


























当然 ，SQL 实际 上 不 需要 遵循 引用 上 述 的 列 的 命名 规则 。 我 设想 (? ) 的 部 
因 是 它 提 供 了 很 多 种 不 同 的 表示 前 面 那个 例子 的 方法 。 下 面 就 给 出 不 同 的 方 
旧 是 我 不 想 去 讨论 具体 的 细节 


SELECT SP.SNO /* 或 下 3S.SNO */ ，ENO ，QTY ，SNRAME ，STATUS ，CITY 
FROM SP JOIN S 






































ON SP.SNO = S.SNO ”/* 泛 意 必须 了 倪 万 (. ) 撑 党 区 */ 


SELECT SNO /* 不 十 S.SNO 或 车 5SP.SNO! */， PNO，,， QTY, SNAME ，STATUS ，CITY 
FROM SP JOIN S 


USING ( SNO ) 


SELECT SP.SNO /* 或 下 S.SNO */， PNO ， QTY ， SNAME ,， STATUS , CITY 
FROM SP ,Ss 
WHERE SP.SNO = S.SNO /* 冰 巧 必 有 贸 贫 郁 (.) 运 常 从 +/ 


11.7.2 ”规范 特性 


的 联 
于 存 








引 顾 第 4 章 , 关系 型 的 联接 运算 符 具 有 交换 性 、 结 合 性 、 自 反 性 。 但 相反 ,SQL 
接 运 算 通 党 不 具有 交换 性 《因为 列 按照 从 左 到 右 排 序 )， 也 不 具有 自 反 性 《由 
在 重复 的 行 “)。 然 而 ， 它 具有 结合 性 。 
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1 我 



































在 SOL and Relational Theory 中 写 到 ， 你 开始 看 到 了 按照 从 左 到 右 的 顺序 处 理 商 业 事务 的 痛苦 了 吗 ? 




















2 也 


于 存在 空 值 。 
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11.7.3 负 卡 儿 乘 积 


看 下 面 笛 卡 儿 乘 积 的 查询 例子 ， 即 “查询 所 有 当前 供应 商 和 零件 号 人 码 对 ”。 
TutorialD 的 格式 如 下 : 


S { SNO } TIMES P { PNO } 


至 于 SQL， 有 两 种 不 同 的 查询 格式 : 


SELECT SNO , PNO 
FROM S CROSS JOIN P 


或 者 更 简单 一 些 的 格式 : 
SELECT SNO , PNO 
FROM 8S ， P 


再 考虑 一 下 第 4 章 的 查询 ， 即 “查询 供应 商 SNO 没有 提供 的 零件 号 PNO 的 有 
序 对 SNO-PNO”。TutorialD 的 格式 如 下 : 


(Ss 1{ SNO } TIMES P { PNO } ) MINUS SP { SNO , PNO } 


SQL 的 格式 如 下 : 


SELECT SNO , PNO 
FROM S, Pp 
EXCEPT CORRESPONDING 
SELECT SNO , PNO 
FROM SP 


































































































11.8 基本 表 表 达 式 的 求 值 


在 Codd 早期 论文 中 曾 给 出 定义 ， 除 了 自然 联接 之 外 ， 还 有 一 个 称 为 “9” 联 
接 的 运算 符 ,“9” 表 示 任 何 一 种 标量 比较 运算 符 ( 如 “=” 各 、“<” 等 等 )。 现 
在 0- 联接 不 再 是 最 初 含义 的 运算 符 。 事实 上 ， 这 里 定义 为 是 乘积 的 比较 运算 (这 就 
是 为 什么 我 没有 在 第 4 章 讨论 的 原因 )。 下 面 是 采用 SQL 格式 给 出 的 儿 个 不 等 联接 
的 例子 ， 即 供应 商 的 城市 与 零件 城市 不 相同 〈 所 以 , 在 SQL 中 ,9 将 换 为 “去” 或 


6 


























































































































SELECT SNO , SNAME 
PNO , PNAME 
FRO S ,P 


WHERE S.CITY <> P.CITY 


采用 下 面 三 个 步 又 来 对 表达 式 求 值 。 
1. 计算 FROM 子 句 ， 得 到 表 S 和 了 的 乘积 。 注意 ， 如 果 按照 关系 型 的 特点 进 


+ STATUS 7 S.CITY AS SCITY ; 
: COLOR , WEIGHT , P.CITY AS PCITY 






































行 操作 ， 至 少 在 计算 成 绩 之 前 要 把 其 


























11.9 表 的 比较 1S1 











中 一 个 CITY 进行 改名 。 但 SQL 不 会 对 它们 











改名 ， 因 为 SQL 表 的 列 按照 从 左 到 右 排序 ， 因 此 可 以 通过 初始 的 顺序 来 区 分 两 个 
CITY， 为 了 简化 ， 这 里 忽略 了 细节 前 
2. 然后 ， 计 算 WHERE 子 句 ， 得 到 乘积 的 限制 运算 结果 ， 即 消除 了 两 个 城市 








值 相 等 的 行 。 





联接 :但 9 为 “=”。 练习 : 等 值 联接 与 自然 联接 的 区 别 ? 
3. 最 后 ， 计 算 SELECT 子 句 ， 得 到 这 个 限制 的 “投影 结果 ” 投影 的 列 采用 
SELECT 子 句 说明。 把 “投影 ”加 上 引号 ， 是 因为 最 终结 果 消 除了 重复 值 ， 就 像 真 


注意 ， 如 果 上 月 
留 两 个 城市 值 相 等 的 行 ， 这 利 

































































分 。 




















日 6 代替 = (或 者 > 这 个 步骤 就 变 为 : 保 
情况 称 为 等 值 联接 。 换 句 话 说， 等 值 联接 也 是 一 种 0- 



























































正 的 投影 运算 一 样 ， 除 非 采用 DISTINCT 说 明 。( 实 际 上 ， 这 个 例子 中 也 执行 了 一 
个 改名 操作 ，SELECT 提供 的 其 他 功能 将 在 第 12 章 中 详细 介绍 ， 所 以 这 里 为 了 简 
化 ， 忽 略 了 细节 部 分 。) 

我 们 来 做 一 个 大 致 的 对 比 ，FROM 子 句 与 乘积 对 应 ，WHERE 子 句 与 限制 运 
算 对 应 ，SELECT 子 句 与 投影 对 应 。 


的 含义 就 是 在 乘积 的 限制 运算 



























































因此 ， 整 个 SELECTFROM-WHERE 表达 式 
上 进行 投影 。 

















所 以 我 上 只 给 出 了 一 个 不 太 严 格 ， 但 相 











对 合理 的 SELECTFROM-WHERE 表达 式 的 语法 定义 ， 即 我 给 出 了 计算 这 个 表达 








式 的 一 个 概念 性 的 算法 。 但 现在 没有 


























任何 迹象 表明 DBMS 使 用 了 这 个 算法 来 计算 









































表达 式 的 值 ， 反 之 ， 它 可 以 使 用 它 喜欢 的 任何 算法 ， 只 要 保证 所 使 用 的 算法 能 够 









































得 到 与 概念 中 定义 的 算法 一 致 的 结果 。 使 用 不 同 的 算法 也 有 很 多 益处 《通常 是 从 


























然而 ， 只 有 说 


性 能 9 度 考 虑 )， 



































因此 可 以 按照 不 
E 明 DBMS 所 使 























同 的 顺序 计算 各 个 子 句 ， 或 者 重 写 原来 的 查询 。 
j 的 算法 在 逻辑 上 等 价 于 定义 的 算法 时 ,， 它 才能 任意 











使 用 算法 。 实 际 上 ， 优 化 器 的 工作 之 一 就 是 找到 一 个 在 概念 上 等 价 、 性 能 更 好 的 
算法 。( 回 顾 第 1 章 ， 优 化 器 就 是 DBMS 的 构件 之 一 ， 负 责 为 如 何 实现 用 户 的 请 
求 来 进行 决策 。) 


11.9 表 的 比较 





























第 4 章 讨论 了 关系 比较 运算 符 “= 























人 办 和 外 :和 (包含 于 )、 CE ( 真 包含 于 )、 








“”( 包 含 )、“ 了”( 真 包含 )。SQL 不 直接 支持 这 些 运 算 符 ， 但 是 可 以 使 用 变通 
的 方法 。 例 如 ， 考 虑 下 面 的 关系 比较 ， 采 用 TutorialD 格式 如 下 : 


Ss{ SNO} 2 sp { SNO} 








该 表达 式 的 含义 为 “查询 没有 


EXISTS 


( 





SELECT 
EXCEPT 
































SNO FROM 5 


CORRESPONDING 

















供应 零件 的 供应 商 信息 ”。 SQL 的 表示 格式 如 下 : 
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SELECT SNO FROM SP 


和 


NOT EXISTS ( 


解释 如 下 ， 回 
当 且 仅 当 | 























SELECT 
EXCEPT 
SELECT 











须 至 少 存 帮 














供应 商 , 而 存在 于 
EXISTS 部 分 。 
为 在 这 两 利 


S 




















口 





p, 注意 
同样 也 可 以 省 略 两 
情况 下， 每 个 操作 的 表 


) 


SNO FROM SP 
CORRESPONDING 
SNO FROM S ) 


子 查询 说 明 的 表 人 至少 包 含 一 行 。 因 
FE 一 个 供应 商 位 于 S 











章 , 如果 要 


个 


依赖 了 


























Pp, 而 不 在 SP 中 , NOT EXISTS 表明 没有 在 SP 中 上 
F SP 到 $ 的 外 码 约束 条 人 
CORRESPONDING， 而 不 会 有 任何 损失 ， 这 


三 | 








Pp 都 上 4 有 


列 。 但 


A 








H 现 








F, 则 可 以 省 略 NOT 


顾 联系 11.1e 的 答案 ，SQL 表达 式 EXISTS 子 查询 返回 值 为 TRUE， 
此 ， 在 前 面 的 表达 式 中 ，EXISTS 表明 必 


的 





是 











包含 的 话 ， 也 不 是 错误 的 。 





因 


顺便 说 一 下 ，SQL 中 的 EXISTS 与 NOT EXISTS 分 别 与 Tutorial D 中 的 IS_ 
NOT EMPTY 和 1IS_EMPTY 对 应 。 


对 了 











6 一 ”上 


I 








信人 全 


汶 口 ， 


于 








但 允许 存在 














“学 ”是 几乎 直接 支持 的 。 下 面 我 来 解释 一 下 。 警 
首先 ， 如 果 我 可 以 被 允许 使 用 这 个 术语 的 话 
是 一 个 包 (bag)( 是 专门 由 一 些 行 组 成 的 包 )。( 




















La 
品 : 





























唱 











E 复 的 元 素 。) 现在 ，SQL 实 际 上 而 








人 7 性 


顾 第 5 章 

















他 








头 





表格 等 价 性 的 说 明 : 我 曾经 说 过 ，SQL 不 直接 支持 关系 比较 运算 符 。 然 而 ， 
这 可 能 会 有 点 复杂 ! 
，SQL 表 的 内 容 不 是 一 个 集合 ， 而 
FP 包 的 概念 ， 即 包 类 似 
< 持 包 的 概念 《被 允许 


使 用 的 术语 是 多 重 集合 ), 这 些 包 包含 了 许多 不 同 种 类 的 元 素 。 具有 若干 的 多 个 包 





只 有 一 利 


| 









































有 可 能 实现 
现在 ， 
的 ， 而 表 
































CITY 上 的 投影 与 表 P 在 CITY 上 的 投 


为 行 包 ， 然 后 在 行 








上 进 


已 








在 SQL 的 行 包 与 SQL 表 之 间 重 要 的 
的 等 值 比较 却 不 支持 。 所 以 如 果 我 想 检测 两 个 





尺 且 


因为 作用 了 





























特例 。 现 在 ，SQL 中 包含 若干 行 的 一 个 包 并 不 等 同 于 SQL 中 的 表 ， 即 使 两 
结构 从 表面 上 看 有 些 相似 ， 这 主要 是 
包含 行 的 包 ( 为 了 简要 讨论 一 下 ， 所 以 我 把 它 
中 一 种 结构 向 另 一 种 结构 的 转化 。 





FSQL 表 的 运算 符 不 适用 于 SQL 中 
门 放 在 前 面 提 了 一 下 )。 然 而 ， 人 至 少 



































区 从 





EB 


行 等 值 检 测 。 




















我 希望 你 能 


里 解 到 目 





前 为 1 





EY A 


的 运算 符 
在 CITY 


TABLE 


TABLE 














( 
( 








SELECT 
SELECT 


被 称 为 T4BLE 的 时 
的 投影 是 否 相 等 ， 可 以 采用 如 下 格式 : 





DIS1 
DIS1 











器， 可 能 又 把 


PINCT 
PINCT 


CI 
CI 











1 然而 ， 寿 





E 任 意 特定 包 





的 元 素 都 必须 是 同样 


类 





TY FROM 5S 
OOM,R 














你 卉 糊涂 了 。 因 





) 
) 


型 的 。 











区 别 是 行 包 的 等 值 比 较 是 直接 支持 
是 否 相等 如: 表 S 在 
否 相等 )， 就 必须 要 把 两 个 SQL 表 转 化 





我 所 讲解 的 内 容 , 但 是 当 我 告诉 你 把 表 转 化 为 行 包 
而 ,为 了 检测 表 S 和 了 
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冒 着 再 把 你 弄 糊涂 的 风险 ， 我 告诉 你 一 个 事实 ， 即 有 TABLE 运算 符 产 生 的 行 












































包 中 的 行 是 没有 列 名 的 。 因 而 ， 前 面 例子 中 进行 的 行 包 实际 上 如 图 11.4 所 示 。 














London 
Paris 
Oslo 


图 11.4 没有 列 名 的 行 包 

顺便 说 一 下 ， 例 子 中 的 DISTINCT 都 是 必须 使 用 的 。 例 如 ， 如 果 London 出 现 
在 表 $ 的 CITY 列 2 次， 而 在 表 P 的 CITY 出 现 了 3 次 (假设 两 个 表 中 都 不 存在 其 
他 的 CITY 值 )， 那 么 相应 的 投影 就 应 该 是 等 价 的 ， 但 是 相应 的 行 包 却 不 等 价 ， 
为 没有 消除 重复 的 行 。 


London 
Paris 
Athens 






































11.10 ”显示 结果 


与 关系 中 的 元 组 一 样 ，SQL 表 中 的 行 从 上 到 下 是 没有 顺序 的 。 但 当 表 格 显 示 在 
终端 屏幕 上 时 ， 这 些 行当 然 必须 按照 从 上 到 下 的 顺序 排列 。 而 且 ， 对 于 用 户 来 说 ， 
这 种 顺序 是 有 意义 、 有 帮助 的 ， 而 不 是 随意 排列 的 《因为 人 类 都 习惯 于 按照 某 种 特 
定 意 义 的 顺序 去 识别 和 处 理 各 类 事情 )。 正 因为 如 此 ，SQL 提 供 了 ORDER BY 运算 
符 ， 是 为 了 给 表 中 的 行 排序 1， 例 如 : 


SELECT SNO , CITY 

FROM S 

WHERE CITY <> "Athens 
ORDER BY CITY 


当然 ， 在 关系 代数 中 没有 与 ORDER BY 对 应 的 运算 符 ， 这 是 因为 ORDER BY 不 
是 关系 运算 符 ， 更 确切 地 说 是 因为 它 的 结果 不 是 关系 型 的 。 现 在 ， 请 不 要 误解 我 了 ， 
我 没有 说 ORDER BY 没有 用 处 ， 我 要 说 的 是 它 不 能 作为 关系 表达 式 的 一 部 分 出 现 。 

事实 上 ，ORDER BY 在 其 他 方面 也 与 关系 代数 的 运算 符 有 所 区 别 ， 例 如 ， 它 
不 是 一 个 函数 。 在 本 书 中 描述 的 关系 代数 的 所 有 运算 符 (事实 上 ， 应 该 用 只 读 运算 
符 这 个 术语 表达 会 更 容易 理解 ) 都 是 函数 ,这 就 意味 着 对 任何 给 定 的 输入 都 只 有 
个 可 能 的 输出 。 相 反 ，ORDER BY 针对 同一 个 输入 可 能 会 产生 几 个 不 同 的 输出 。 
因此 ， 考 虑 上 面 的 ORDER BY 例子 ， 可 能 会 产生 如 下 儿 种 输出 (为 了 简化 ， 这 里 
只 给 出 了 供应 商号 码 ， 省 略 了 其 他 信息 ): 


































































































































































































































































































1 Tutorial D 支持 类 似 的 操作 符 ， 称 为 ORDER。 
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DD Sl1,S4,S3,S5 
DD S1,S4,S5 ,S3 
D S4,S1,S3 , S5 
DD S4,S1,S5,S3 

对 函数 的 解释 : 我 曾经 说 过 ， 本 书 中 描述 的 关系 代数 的 所 有 运算 符 都 是 函数 。 
然而 ， 我 要 提醒 的 是 ， 这 些 运算 符 与 SQL 中 对 应 的 部 分 却 大 多 都 不 是 函数 ! 这 是 
因为 (就 像 在 第 10 章 解 释 过 的 ) 即 使 v1 和 v2 不 同时 ,SQL 有 时 也 认为 比较 式 v1=v2 
的 值 为 TRUE。 例 如， 考虑 字符 串 “Paris” 和 “Paris ”( 注 意 第 2 个 字符 串 后 面 带 
有 空格 )， 显 然 它 们 是 不 相等 的 ， 然 而 SQL 有 时 却 把 它们 看 作 是 相等 的 。 因 此 ， 按 
照 标 准 , 特定 的 SQL 表达 式 被 称 为 “可 能 的 非 确定 性 ”下 面 给 出 一 个 简单 的 例子 : 

SELECT DISTINCT CITY FROM S 

如 果 某 个 供应 商 的 CITY 值 为 “Paris”， 另 一 个 为 “Paris ” 那么 结果 中 或 者 
包含 “Paris”， 或 者 包含 “Paris ”( 也 可 能 都 包含 )， 但 是 我 们 会 获得 哪 一 种 结果 却 
是 不 确定 的 ， 可 能 今天 获得 一 种 结果 ， 明 天 又 获得 另 一 种 结果 ， 即 使 数据 库 内 部 的 
数据 根本 没有 改变 过 。 你 可 能 喜欢 思考 这 种 情况 的 隐 含 意思 。 

























































































































































































11.11 练习 工 


11.3” 当 显示 一 张 表 时 例如， 显示 在 屏幕 上 )， 表 中 的 行 是 按照 从 上 到 下 的 
顺序 排列 的 ， 或 者 按照 ORDER BY 显示 说 明 的 顺序 排列 ， 如 果 省 略 ORDER BY， 
就 按照 随机 顺序 显示 《〈 可 能 由 系统 决定 ， 也 可 能 是 非 预期 的 )。 但 是 列 如 何 按照 从 
左 到 右 的 顺序 显示 呢 ? 

11.4 按照 下 列 TutorialD 的 格式 ， 写 出 相应 的 SQL 格式 。 


a. P { PNO } MINUS ( SP WHERE SNO = ‘S2’ ) { ENO } 


























运 















































(NREC 1 :CITY } J) UNEON, ‘Pt CITY. 才 

Ss { SNO } MINUS ( S { SNO } MINUS SP { SNO } ) 

SP MINUS SP 

S INTERSECT S 

( S WHERE CITY = ‘Paris’ ) UNION ( S WHERE STATUS = 20 ) 


S JOIN SP JOIN P 


Fo mo roo 


((S RENAME {CITY AS SC }){ SC}) JOIN 


(( P RENAME {CITY AS PC }) {PC}) 
11.5 写 出 下 列 查 询 的 SQL 格式 ， 即 “查询 供应 商号 码 对 、 了 对 和 了 了， 要 求 供应 
商 卫 和 了 位 于 同一 个 城市 ”。 























11.12 ”答案 II 


11.3 在 SQL 中 这 不 算是 问题 ， 因 为 SQL 表 的 列 就 是 按照 从 左 到 右 次 序 排 列 


的 。 从 左 到 右 的 

















守 这 个 简单 的 规则 )。 对 于 


须要 设 定 菜 利 
































11.4 下 列 答案 并 不 是 唯一 的 。 


a. SELECT PNO FROM P 


EXCEPT CORRESPONDING 
SELECT PNO FROM SP 
WHERE SNO = 'S2" 


b. ( SELECT CITY FROM S 











INTERSECT CORRESPONDING 








SELECT CITY FROM P 
UNION CORRESPONDING 
SELECT CITY FROM P 














Cc. SELECT SNO FROM S 


EXCEPT CORRESPONDING 
( SELECT SNO FROM S 











) 





EXCEPT CORRESPONDING 





SELECT SNO FROM SP 


) 





这 个 表达 式 也 可 以 简化 (1 








读者 自行 完成 )。 








d. SELECT * FROM SP 


EXCEPT CORRESPONDING 
SELECT * FROM SP 




















11.12 答案 I 155 


顺序 显然 与 表 中 定义 的 顺序 相同 (我 确信 ， 所 有 的 SQL 产品 都 遵 
象 Tutorial D 这 样 的 关系 语言 来 说 ， 这 也 不 算是 问题 。 
因为 可 以 通过 我 们 正在 讨论 一 些 非 关 系 型 操作 来 定义 。 当 然 , 真正 的 关系 型 系统 必 
Fr 规则 来 决定 结果 显示 的 顺序 。 然而， 这 个 规则 对 于 纯粹 的 、 系 统 支 持 
的 关系 型 语言 (如 Tutorial D 或 其 他 ) 是 不 可 见 的 。 














注意 该 格式 中 的 括号 。 当 然 ， 上 面 的 表达 式 还 可 以 简化 (由 读者 自行 完成 )。 


当然 ， 这 个 结果 是 空 集 。 事 实 上 ， 这 个 表达 式 风 辑 上 完全 等 价 于 如 下 格式 : 


SELECT * FROM SP WHERE FALSE 


e. SELECT * FROM S 








INTERSECT CORRESPONDING 








SELECT * “FROM.S 








该 表达 式 的 结果 完全 等 同 于 表 $ 的 当前 值 。 
于 如 下 格式 ; 



































EF， 该 表达 式 逻 辑 上 完全 等 价 





SELECT * FROM S WHERE TRUE 
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WHERE TRUE 有 时 也 可 以 省 略 。 
f. SELECT * FROM S WHERE CITY = ‘Paris’ 


UNION CORRESPONDING 
SELECT * FROM S WHERE STATUS = 20 


该 表达 式 迪 辑 上 完全 等 价 于 如 下 格式 : 


SELECT * FROM S WHERE CITY = 'Paris' OR STATUS = 20 

















Ee; SELECT * FROM S NATURAL JOIN SP NATURAL JOIN P 





h. SELECT DISTINCT. ‘S.CITY AS SC , PCITY AS PC FROM’S , P 


11.3 SELECT X.SNO AS XNO ,YY.SNO AS YNO 
FROM S ASX, SASY 
WHERE X.CITY = Y.CITY 
AND  X.SNO < Y.SNO 


、 


注意 ， 这 里 使 用 了 域 变 量 X 和 YY。 但 是 ， 我 们 需要 DISTINCT 吗 ? 
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第 12 章 


SQL 运算 符 | 


功能 在 猜测 中 被 抑制 。 
William Shakespeare: Macbeth (1606) 





bg 











第 5 章 中 ， 在 20 世纪 60 年 代 末 和 70 年 代 初 Codd 定义 的 初始 运算 符 基础 上 ， 
我 描述 了 一 些 特定 的 附加 关系 运算 符 ， 并 专门 讨论 了 (a) MATCHING 和 NOT 
MATCHING; (b) EXTEND; (c) 快照 关系 ; (d) 聚集 、 归 纳 及 其 他 。 下 面 我 们 
来 看 看 SQL 是 如 何 提供 这 些 相 关 功 能 的 。 














yu 
































12.1 MATCHING 与 NOT MATCHING 


下 面 先 给 出 在 第 5 章 介 绍 半 联接 运算 时 使 用 的 查询 (在 Tutorial D 中 为 
MATCHING )， 即 查询 1:“ 查询 至 少 提 供 了 一 种 零件 的 供应 商 的 所 有 信息 ”。 
Tutorial D 的 格式 如 下 : 

S MATCHING SP 

SQL 中 没有 直接 与 MATCHING 一 致 的 运算 符 ， 但 是 通过 在 子 查 询 中 使 用 IN 
来 完成 查询 : 


SELECT SNO , SNAME , STATUS , CITY 



















































































FROM S 
WHERE SNO IN 
( SELECT SNO 
FROM SP ) 






































可 顾 第 11 章 的 练习 11.1 的 答案 ，SQL 的 子 查 询 基 本 上 是 封装 在 括号 里 的 
SELECTFROM-WHERE 表达 式 。 至 于 IN 运算 符 ， 则 是 一 个 布尔 表达 式 : 


站 让 "了 村 十 芭 
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如 果 由 行 表达 式 rx 说 明 的 行 x 出 现在 由 基本 表 表 达 式 tx 说 明 的 表 上 中 ， 那 么 
该 表达 式 返 回 值 为 TRUE， 和 否则 返回 值 为 FALSE。 因 此 ， 在 该 例子 中 ， 首 先 返回 子 
查询 的 值 ， 然 后 返回 如 图 12.1 所 示 的 表 。 





























EE 










































































SNO 


Sl 
S2 
S33 
S4 


图 12.1 查询 1 的 子 查询 结果 

然后 计算 外 查询 的 值 ， 返 回 值 表 S 的 子 集 ， 即 四 个 供应 商 之 一 。 

实际 上 ， 这 里 讨论 的 查询 可 以 采用 很 多 种 SQL 格式 来 表达 《实际 上 ， 每 一 个 
查询 都 是 这 样 )。 下 面 给 出 另外 一 种 表达 方式 ， 使 用 EXISTS 代替 IN: 


SELECTI SNO , SNAME ; STATUS , CIIY 



























































FROM S 
WHERE EXISTS 
( SELECT SNO 
FROM SP 


WHERE SP.SNO = S.SNO ) 


也 可 以 使 用 自然 联接 来 表示 : 


SELECT DISTINCT SNO ， SNAME ， STATUS , CITY 
EROM S NATURAL JOIN SP 


注意 后 面 的 这 个 格式 只 是 用 来 说 明 S$ 和 SP 的 半 联 接 定义 (参见 第 5 章 )。 一 句 话 
的 忠告 : 这 里 SELECT 子 句 中 阁 用 “S.*” 代 蔡 列 的 逗号 列表 ， 则 会 产生 错误 。 在 SOL 
and Relational Theory 中 解释 了 复杂 的 原因 。 而 且 也 不 能 采用 “*?” 代 替 列 的 去 号 列表 。 

现在 转 到 半 差 运算 〈 等 同 于 Tutorial D 中 的 NOT MATCHING), 仍然 采用 第 5 
章 中 的 查询 来 介绍 这 个 运算 符 ， 即 “查询 没有 供应 零件 的 供应 商 信 息 ”。Tutorial D 
的 格式 如 下 : 

S NOT MATCHING SP 

SQL 中 没有 与 之 对 应 的 格式 , 但 是 可 以 采用 NOT IN 子 查询 的 方式 来 实现 , 如 下 : 


SELECT SNO , SNAME , STATUS , CITY 


















































































































































FROM S 
WHERE SNO NOT IN 
( SELECT SNO 
FROM SP ) 


当然 ， 表 达 式 rx NOT IN tr 逻辑 上 等 价 于 NOT (xx IN x)。 
另外 ， 也 可 以 采用 NOT EXISTS 实现 上 述 查 询 : 











12.2 EXTEND 1S9 













































































SELECT SNO , SNAME ， STATUS , CITY 
FROM S 
WHERE NOT EXISTS 
( SELECT SNO 

FROM SP 

WHERE SP.SNO = S.SNO ) 
下 没有 明显 的 方法 在 该 查询 中 使 用 NATURAL JOIN， 除 非 我 们 只 是 想 按 顺序 

曾 明 S 和 SP 之 间 的 半 差 的 定义 〈 见 第 5 章 )， 具 体 如 下 

SELECT SNO , SNAME , STATUS , CITY 
ERO S 
EXCEPT CORRESPONDING 
SELECT SNO , SNAME , STATUS , CITY 
FRO. S NATURAL JOIN SP 


12.2 EXTEND 









































这 里 仍然 使 用 第 5 章 的 查询 来 介绍 EXTEND， 即 “查询 每 个 零件 的 详细 信息 ， 
用 克 来 表示 零件 的 重量 ”。TutorialD 的 格式 如 下 : 

EXTEND P : { GMWT := WEIGHT * 454 } 

SQL 的 格式 如 下 : 

SELECT PNO , PNAME , COLOR , WEIGHT , CITY ， 

( WEIGHT * 454 ) AS GMWT 

FROM PP 

注意 : SQL SELECT 子 句 确实 涉及 很 多 领域 ， 在 第 11 章 中 我 们 已 经 看 到 与 关 





系 投影 


和 改名 操作 对 应 的 SQL 格式 都 











是 依据 该 子 句 实现 的 。 现 在 我 们 来 看 看 如 何 








依赖 该 子 句 实 现 EXTEND， 在 本 章 后 面 我 们 还 将 看 到 该 子 句 的 另 一 个 作用 。 


第 





bE 5 章 中 
( 人 





这 个 查询 


EXTEND P : 





关于 EXTEND 的 第 2 个 例子 如 下 : 


:= WEIGHT * 454 } ) 
WHERE GMWT > 7000.0 ) 
{ ENO ， 


的 目的 是 获得 零件 重量 大 于 7000 克 的 所 有 零 伯 





{ GMWT 


GMWT } 


号 码 及 重量 


忆 




















和 











( 


























示 )。 下 面 洲 


SELECT PN 


FROM 


SQL 格式 来 实现 该 查询 : 


O ( WEIGHT * 454 ) 


AS GMWT 


了 





WHERE G 


一 个 列 名 , 而 表 P 


该 表达 式 就 会 


WT > 7000.0 

希望 您 已 经 发 现 这 个 格式 是 不 了 
p 没 有 此 列 名 ， 

报错 。 注意: 






































E 确 的 。 原 因 是 GMWT 是 结果 表 中 的 
因而 WHERE 子 句 没有 任何 实际 意义 ,在 编译 时 
问题 的 原因 是 我 们 需要 在 限制 条 件 之 前 进行 扩展 (就 像 
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Tutorial D 的 格式 )， 但 SQL 却 是 在 扩展 之 前 执行 限制 (回顾 第 11 





























章 中 给 出 的 


SELECT-FROM-WHERE 表达 式 求 值 的 概念 性 算法 ， 已 经 表明 轴线 判断 FROM 子 

















句 ， 然 后 是 WHERE 子 句 ， 最 后 是 SELECT 子 句 。 

















现在 , 修正 前 面 问题 的 一 种 方法 就 是 在 WHERE 子 句 中 用 定义 的 表达 式 来 代替 








对 GMWT 的 引用 ， 即 : 


SELECT PNO , ( WEIGHT * 454 ) AS GMWT 
FROM P 
WHERE ( WEIGHT * 454 ) > 7000.0 

















1 个 优化 器 只 识别 计算 该 子 表达 式 1 次 ， 而 不 是 2 次 。 


当然 ， 子 表达 式 WEIGHT * 454 在 整个 表达 式 中 出 现 了 2 次 , 我 们 希望 可 以 有 





























清晰 地 表示 该 方式 ， 采 用 完全 显示 的 域 运算 符 来 显示 说 明 ); 
SELECT TEMP.PNO , TEMP.GMWT 
FROM ( SELECT PNO , ( WEIGHT * 454 ) AS GMWT 


FROM P ) AS TEMP 
WHERE TEMP.GMWT > 7000.0 

















到 的 结果 表 '。 


因此 ， 另 外 一 种 方式 就 是 采用 与 Tutorial D 有 些 近似 的 方式 实现 该 查询 (为 了 





注意 该 例子 中 FROM 子 名 的 子 查 询 ， 也 注意 名 字 TEMP 指 的 是 子 查 询 计算 后 得 














下 面 多 列举 一 些 第 5 章 给 出 的 Tutorial D 格式 表示 的 EXTEND 例子 ,采用 SQL 














格式 表示 的 语法 : 
1]. EXTEND S : { TAG := ‘Supplier’ } 
SQL 格式 如 下 : 
SELECT SNO , SNAME , STATUS , CITY , 'Supplier' AS TAG 
FROM Ss 
2, EXTEND ( P JOIN SP ) : { SHIPWT := WEIGHT * QTY } 
SQL 格式 如 下 : 
SELECT PNO , PNAME , COLOR , WEIGHT , CITY , SNO , QTY 


了 


( WEIGHT * QTY ) AS SHI 
FROM P NATURAL JOIN SP 


3,. ( ( EXTEND P : { GMWT := WEIGHT * 454 } ) { ALL BUT WEIGHT 














PWT 


上 中 


RENAME { GMWT AS WEIGHT } 


注意 ， 这 个 表达 式 的 含义 是 “如 果 …， 那 么 …” 的 查询 ，SQL 格式 如 下 : 


























1 实际 上 ，TEMP 不 是 一 个 真正 的 表 的 名 字 ， 相 反 ， 它 是 一 个 域 变量 ， 就 像 在 第 11 童 





























PP 定义 的 一 样 。 























而 且 要 注意 SQL 规则 规定 了 FROM 子 句 的 子 查 询 必须 与 用 AS 显 式 定 义 的 域 变量 相 
个 表达 式 中 没有 显 式 引 用 这 个 域 变量 。 






































一 致 ， 即 使 整 


SELECT ENO ， 
FROM P 


12.3 ”映像 关 


PNAME ， 


COLOR , ( 


系 





WEIGHT * 454 ) 


SQL 没有 直接 等 价 于 Tutorial D 格式 的 映像 关系 ， 


























映像 关系 表示 的 查询 很 









































D 表达 式 ， 即 “查询 供 











S WHERE ( llsSP ) { PNO } =P { PNO } 
一 种 可 能 的 SQL 格式 如 下 ; 
SELECT SNO AD SNAMR STATUS.., CITY 
FROM 3 
WHERE NOT EXISTS 
("SELECT 
FROM 卫 
WHERE NOT EXISTS 
( SELECT * 
FROM SP 
WHERE S.SNO = SP.SNO 
AND SP.PNO = P.PNO ) 
该 查询 的 含义 是 ， 获 得 供应 商 s 的 信息 ， 





提供 了 p 但 不 存在 于 SP 中 。 或 者 到 



































零件 ， 它 没有 供应 (注意 采用 了 双重 否定 )。 

















12.4 ”聚集 和 


归纳 




















如 果 你 需要 重新 弄 


任用 SQL 表示 。 这 里 仅仅 给 
应 了 所 有 零件 的 供应 商 信 ， 








) ; 
对 于 











AS WEIGHT ， 
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CLTY. 





因此 ， 在 Tutorial D 中 采用 
一 个 例子 ， 巨 
息 ”。Tutorial D 格式 如 下 : 











顾 下 面 的 Tutorial 














冀 供 应 商 s， 不 存在 零件 p， 它 











E 解 为 ， 获 得 这 术 








供应 商 的 信息 ， 即 不 存在 一 个 








解 聚 集 和 归纳 的 概念 ,请 回顾 第 5 章 ， 该 章 中 提供 了 很 多 的 














资料 可 以 帮 你 复习 ， 当 然 只 需要 关注 丸 
典型 的 聚集 运算 符 ， 如 COUNT、SUM、AVG、MAX、MIN、AND、OR 
























































Bb 些 与 SQL 一 致 的 特征 ， 即 : 


及 XOR， 这 些 运 算 符 的 作用 是 从 关系 的 某 些 属性 值 的 聚集 〈 如 集合 或 包 ) 


























口 

来 产生 
口 
我 们 已 经 知道 

































































以 用 来 显 式 说 明 处 理 这 样 的 事情 ， 下 面 将 详细 




















聚集 运算 符 有 2 个 作用 ， 一 是 用 于 归纳 ， 二 是 
限制 ”回顾 一 下 ， 映 像 关系 几乎 两 种 情况 都 会 涉及 。 
SQL 不 文 持 映像 关 
《如 果 你 恰好 对 SQL 有 所 了 解 的 话 ， 后 面 的 声明 会 让 你 感到 吃惊 。) 但 是 它 8 
支持 归纳 和 衍生 的 限制 。 事 实 上 ， 它 有 2 个 特 和 






































个 结果 值 (COUNT 有 些 特殊 ， 聚 集 时 作用 于 整个 关系 ) 
于 第 5 章 提 到 的 “衍生 的 











系 ， 现 在 我 要 声 





讨论 。 





明 它 


也 不 支持 聚集 运算 符 。 
I 实 不 























FE〈 即 GROUP BY 和 HAVING) 可 
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12.4.1 ”归纳 
首先 ， 采 用 Tutorial D 格式 来 表示 如 下 的 查询 ， 即 查询 1:“ 对 于 每 个 供应 商 ， 
查询 供应 商号 码 及 提供 的 零件 数量 ”。 

EXTEND 9 { SNO } : { PCT := COUNT (Qsp ) } 


查询 结果 如 图 12.2 所 示 。 




































































图 
































采用 SQL 表示 格式 如 下 : 
SELECT S.SNO , ( SELECT COUNT ( PNO ) 
FROM SP 
WHERE SP.SNO = S.SNO ) AS PCT 





FROM S 


注意 该 例 中 SELECT 子 句 中 的 子 查询 〈 和 采用 AS 规则 说 明 与 结果 列 的 列 名 )。 
就 像 第 11 章 中 提供 的 例子 11.1d 一 样 〈 这 里 首先 遇 到 了 SQL 子 查 询 的 概念 ), 这 里 
需要 给 出 一 些 解释 。 首 先 ， 该 例 的 子 查 询 是 相关 子 查 询 《〈 参 见 第 11 章 例子 11.1e 
的 答案 )， 意 思 是 它 包 含 了 对 外 部 表达 式 定 义 的 某 些 事情 的 引用 ， 更 特殊 的 是 针对 
每 一 个 外 部 引用 都 需要 反复 进行 判断 。(〈 该 例子 中 的 外 部 引用 就 是 对 出 现在 子 查询 
WHERE 子 句 中 的 S.SNO 的 引用 。) 所 以 你 可 以 想象 一 下 ， 对 该 表达 式 的 求 值 要 通 
过 检查 外 部 表 《〈 如 例子 中 的 表 $) 的 多 行 来 完成 ， 一 次 要 检查 一 行 。 我 们 来 考虑 一 
下 表 $ 中 的 某 行 ， 如 供应 商 S1 的 行 ， 子 查询 就 转化 为 如 下 形式 : 


图 12.3 子 查 询 的 结果 表 



























































































































































( SELECT COUNT ( PNO ) 
FROM SP 
WHERE SP.SNO = 'S1' ) 


该 表达 式 将 返回 具有 1 行 1 列 的 表 ， 如 图 12.3 所 示 〔 列 没有 列 名 )〉'。 
































1 同样 ， 该 图 中 缺少 下 划 线 并 不 是 错误 。 
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现在 发 生 了 双重 强制 类 型 转换 (例如 ， 隐 式 的 类 型 转换 )。 这 个 表格 被 迫 变 成 一 行 ， 
反 过 来 该 行 只 有 一 个 标量 值 。 这 个 标量 值 变 成 了 整个 结果 行 中 供应 商 S1 的 PCT 值 〈 由 
于 规则 中 说 明 为 PCT), 对 于 表 S 中 的 每 一 行 都 要 重复 这 个 过 程 ,从 而 得 到 最 终 的 结果 值 。 

语法 注释 : 现在 我 们 已 经 看 到 了 SELECT 子 名 的 子 查询 、FROM 子 句 的 子 查 
询 、WHERE 子 句 的 子 查询 ， 但 是 你 注意 到 这 些 子 查询 何 时 返回 标量 值 、 何 时 返回 
表 吗 ? (事实 上 ， 它 们 有 时 既 不 返回 标量 、 也 不 返回 表格 ， 而 是 返回 行 ， 但 我 不 打 
算 给 出 更 详细 的 例子 ， 也 不 给 出 更 多 的 讨论 .。 ) 你 如 何 看 待 SQL 规则 可 能 看 起 来 像 
在 特定 的 环境 下 决定 子 查 询 的 类 型 以 及 对 子 查询 的 解释 ? 

现在 应 该 来 解释 一 下 ， 前 面 那个 查询 的 SQL 格式 也 许 不 是 大 多 数 SQL 从 业 人 
员 喜 欢 使 用 的 查询 的 方式 ， 相 反 ， 他 们 更 喜欢 使 用 如 下 的 格式 ; 


SELECT SNO , COUNT ( PNO ) AS PCT 
ERO SP 
GROUP BY SNO 


解释 : 假设 ! 就 是 由 FROM 和 WHERE 子 句 产生 的 结果 表 〔 在 该 例 中 ，t 只 是 
SP， 因 为 没有 WHERE 子 句 ， 省 略 的 部 分 就 等 价 于 WHERE TRUE)， 然 后 计算 
GROUP 子 句 ， 它 也 会 产生 一 定 的 影响 〈 至 少 从 概念 上 理解 是 这 样 )， 即 把 表 中 的 行 分 
成 若干 组 ， 这 样 的 每 个 组 都 有 一 个 唯一 的 值 ， 被 称 作 “ 分 组 的 列 ”( 在 该 例 中 ， 每 个 组 
都 按照 唯一 的 SNO 进行 分 组 )。 最 后 ， 计 算 SELECT 列 ， 它 重新 构造 每 一 行 ， 每 一 组 的 
每 一 行 都 由 SNO 和 相应 的 PCT 值 组 成 〈 例 如 ， 对 应 的 统计 值 )。 但 这 其 实 是 一 个 陷阱 ， 
表 SP 的 供应 商 $5 没有 对 应 的 行 ， 所 以 在 结果 的 分 组 操作 中 就 没有 供应 商 S5 的 分 组 ， 
因此 ， 最 后 的 结果 中 就 没有 供应 商 S5 对 应 的 行 ， 换 名 话说 ， 其 结果 值 如 图 12.4 所 示 。 
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图 12.4 GROUP BY 查询 执行 结果 





事实 上 ， 作 为 SQL (或 者 SEQUEL) 的 一 部 分 ，GROUP BY 从 一 开始 就 要 正 
确 处 理 ， 显 式 说 明 来 帮助 完成 类 似 于 上 面 讨论 的 那 种 查询 ， 即 (a) 或 者 从 来 不 使 
用 它 ， 或 者 不 使 用 上 面 讨论 的 那 种 格式 ; (b) 使 用 时 需要 小 心 处理 ， 以 避免 产生 刚 
刚 说 明 的 类 似 问题 。 
这 个 例子 其 实 还 没有 介绍 完 ， 下 面 还 要 说 明 一 点 。 再 考虑 一 下 如 下 的 格式 : 
SELECT S.SNO , ( SELECT COUNT ( PNO ) 
FROM SP 
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WHERE SP.SNO 
ERO S 


现在 看 看 子 查 询 5 


= .5.SNO ) AS PCT 








FP 的 “COUNT (PNO)”, i 


支部 分 没有 构成 对 聚集 运算 符 的 调用 ! 
(这 是 因为 以 前 我 曾经 声明 过 : SQL 对 聚集 运算 符 没 有 恰当 的 支持 语法 。) 因此 如 果 这 
个 构造 确实 代表 了 


个 聚集 运算 符 的 调用 ， 我 们 应 该 可 以 写 出 如 下 的 SQL 赋值 语 铝 : 
= COUNT ( 

































































SE :PECL 











PNO ) }; 


但 很 显然 ， 我 们 不 能 。 





















































导 其 供应 商号 但 ， 及 供应 货物 的 总 量 ” 


心里 








现在 考虑 另 一 个 例子 〈 对 前 面 例子 稍微 修改 了 一 下 )， 即 查询 2:“ 对 于 每 个 供 
应 商 ， 获得 


EXTEND S { SNO } 





。Tutorial D 格式 如 下 : 


: { TOTO := (SP , QTY ) } 


:= SUM 
查询 2 的 运行 结果 如 图 12.5 所 示 。 














图 12.5 

















查询 2 的 运行 结果 





SQL 格式 如 下 : 
SELECT S.SNO 


7/ ( SELECT SUM ( QTY 



























































) 
FROM SP 
WHERE SP.SNO = S.SNO ) AS TOTO 
FROM 8S 
但 是 现在 又 产生 了 另 一 个 陷阱 : 供应 商 S5 的 供应 总 量 值 是 一 个 空 集 的 总 和 。 
从 风 辑 上 来 说 ， 空 集 的 总 和 当然 是 0， 但 是 SQL 把 它 定义 为 空 (nul1)“， 因 此 在 该 
例 中 产生 了 如 下 不 正确 的 结果 ， 如 图 12.6 所 示 。 

















图 12.6 查询 2 的 不 正 














出 由 





和 实 上 ， 在 SQL 
会 返 请 























PF， 如 果 变 量 是 空 值 的 话 ，SUM、AVG、MAX、MIN、EVERY、SOME 运算 也 都 
空 值 (最 后 两 个 运算 与 Tutorial D 中 的 AND 和 OR 运算 特别 相似 ),(SQL 中 没有 XOR 运算 ) 
COUNT 是 特殊 的 一 个 ， 如 果 它 的 变量 为 室 ， 则 返回 结果 为 0。 
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该 例子 只 是 说 明了 许多 特殊 情况 中 的 一 种 ， 即 SQL 表达 式 可 以 返回 带 有 空 值 的 
表 ， 即 使 输入 的 值 不 包含 任何 的 空 值 。 因 此 我 们 必须 要 避免 空 值 的 产生 ， 我 们 所 需要 
的 是 有 一 个 运算 符 能 够 在 空 值 出 现 的 时 候 用 一 个 真实 的 值 奉 代 它 〈 在 它 还 没有 机 会 产 
生 破 坏 之 前 )， 这 个 运算 符 叫 作 COALESCE。 因 此 ， 前 面 那个 SQL 表达 式 修正 如 下 : 


SELECT S.SNO , ( SELECT COALESCE ( SUM ( QTY ) ，0) 
FROM SP 
WHERE SP.SNO = S.SNO ) AS TOTO 












































































































































ERO 3 

解释 如 下 : 通常 情况 下 ， 表 达 式 COALESCE (exp1,exp2,…,expn) 返 回 表达 式 列表 
《按照 从 左 到 右 的 顺序 ) 中 第 一 个 表达 式 的 值 ， 来 代表 一 个 真实 的 值 ， 从 而 替代 衬 
值 ,这 里 exp1,exp2,.…expn 是 一 个 具有 相同 类 型 的 、 采 用 逗号 分 隔 的 表达 式 列表 :。 因 
此 在 该 例 中 , 如 果 给 定 的 供应 商 至 少 存 在 一 种 供应 关系 , 那么 就 会 得 到 正确 的 总 和 。 
但 如 果 某 些 供应 商 根本 不 存在 供应 关系 ， 则 SQL 就 会 返回 空 值 ， 那 么 COALESCE 
就 立即 用 0 替代 空 值 。 


12.4.2 “通用 的 限制 ” 

在 第 5 章 我 使 用 术语 “通用 的 限制 ”(generalized restriction) 来 表示 r WHERE 
bx， 这 里 布尔 表达 式 bx 需要 调用 聚集 运算 符 ， 而 且 也 会 引用 一 个 映像 关系 (至 少 
在 Tutorial D 中 是 这 样 的 )， 下 面 给 出 一 个 例子 (查询 3: 查询 供应 关系 小 于 3 的 
供应 商 信息 ): 

S WHERE COUNT (WMSP ) <3 


查询 3 的 运行 结果 如 图 12.7 所 示 。 





Xl 
卫 | 















































































































































































































































STATUS CITY 


10 Paris 
30 Paris 
30 Athens 


图 12.7 查询 3 的 运行 结果 
SQL 的 格式 如 下 (请 注意 WHERE 子 句 中 的 子 查 询 ): 


SELECT SNO , SNAME , STATUS , CITY 
FROM S 
WHERE ( SELECT COUNT ( PNO ) 

FROM SP 

WHERE SP.SNO = S.SNO ) < 3 



































1 当然 ， 最 好 存在 这 样 的 表达 式 ， 因 为 COALESCE 调用 本 身 就 会 返回 空 值 。 
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然而 ， 这 种 格式 不 是 大 多 数 习惯 使 用 SQL 的 用 户 所 希望 使 用 的 格式 。 相 反 ， 









































大 多 数 习惯 于 SQL 格式 的 用 户 会 使 用 如 下 格式 : 
SELECT SNO , SNAME , STATUS , CITY 
FROM § NATURAL JOIN SP 


GROUP BY SNO 
HAVING COUNT 





( PNO ) 


< 


解释 如 下 : HAVING 子 句 相当 于 每 个 分 组 后 的 WHERE 子 句 ， 也 就 是 说 ， 





























































































































































































































进一步 讨论 后 会 消除 某 些 特定 的 组 ,就 像 使 用 WHERE 子 句 会 消除 某 些 行 一 样 。 
(注意 : SQL 表达 式 中 ，HAVING 子 句 也 可 以 使 用 GROUP BY。) 但 这 又 是 一 个 
陷阱 ， 供 应 商 S2 和 S3 的 分 组 都 通过 了 HAVING 的 检测 ， 所 以 这 些 供应 商 的 信 
息 会 出 现在 最 后 的 结果 中 (相反 ,供应 商 S1 和 S4 没有 通过 检测 )。 但 对 于 供应 
商 S$S5， 却 没有 分 组 ， 这 是 因为 在 NATURAL JOIN SP 运算 后 的 结果 里 不 存在 供 
应 商 S5 的 行 ， 所 以 最 后 的 结果 中 就 没有 显示 供应 商 S51 换 句 话说 ， 其 运行 结 
果 如 图 12.8 所 示 。 
10 
30 
图 12.8 ”查询 3 的 SQL 运行 结果 
事实 上 , 显 式 说 明 HAVING 可 以 有 助 于 完成 上 述 查 询 , (a) 要 么 不 使 用 它 ; (b) 
































]， 需 要 注意 它 的 正 

















用 法 (就 像 GROUP BY)。 








用 





如 果 使 


下 面 再 举 一 个 例子 , 查询 4:“ 查 询 供 应 

















~ 
所 旦 - 


/ 忆 里 . 


少 于 1000 的 供应 商 信息 ”Tutorial 











D 的 格式 如 下 : 





< 1000 


S WHERE SUM 


SQL 格式 如 下 (注意 COALESCE 的 用 法 ， 


应 商 $5 的 信 | 


SELECT SNO 
S 


EROM 


WHERE ( 


最 后 再 给 出 一 个 稍 
商号 码 以 及 供 








( EX 


( llsP , QTY ) 























后 的 结 





目的 是 保证 最 














TEND S { SNO } 


息 ): 


7 SNAME ,; STATUS ; CITY 


SELECT COALESCE SUM 0 
FROM S 


WHERE  S 


( (OB) ) 


了 
Pp 


p . SNO ) 
复杂 一 些 的 例子 ， 查 询 5:“ 查 询 供 应 总 量 
应 数量 ”。 Tutorial D 的 格式 如 下 : 


(llsP , QTY ) 


S.SNO < 1000 


























达 于 250 








: { TOTO := SUM ) 


果 中 存在 供 

















的 供应 


WHERE TOTQ > 250 


SQL 格式 如 下 : 


ELECT TEMP.SNO , TEMP.TOTO 
ROM ( SELECT SNO , ( SELECT COALESCE ( SUM ( QTY ) ,， 0 ) 
FROM SP 
WHERE SP.SNO = S.SNO ) AS TOTO 
FROM Ss ) AS TEMP 
WHERE TEMP.TOTO > 250 


(CD 





[ea 





12.5 练习 








给 出 下 列 Tutorial D 表达 式 的 SQL 语法 格式 : 
P MATCHING S 








a 
b. § NOT MATCHING ( SP WHERE PNO = ‘P2’ ) 
C。 EXTEND P : { SCT := COUNT ( (SP ) } 

d 





P WHERE SUM ( llSP , QTY ) < 500 


12.6 ”答案 


a. SELECT PNO , PNAME , COLOR , WEIGHT , CITY 





FROM P 
WHERE CITY IN ( SELECT CITY 
FROM Ss ) 
b. SELECT SNO , SNAME , STATUS , CITY 

FROM 5S 
WHERE SNO NOT IN ( SELECT SNO 

FROM SP 

WHERE PNO = 'P2' ) 


C。 SELECT PNO , PNAME , COLOR , WEIGHT , CITY ， 
( SELECT COUNT ( SNO ) 
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FROM SP 
WHERE: SPSPNO = .PPNO. AS SCT 
FROM P 
d. SELECT PNO , PNAME , COLOR , WEIGHT , CITY 
FROM 下 
WHERE ( SELECT COALESCE ( SUM ( QTY ) ，0) 
FROM SP 


WHERE SP.PNO = P.PNO ) < 500 








说 明 : 答案 不 是 唯一 的 ， 以 上 答案 仅 供 参考 。 


第 13 章 


SQL 约束 


黄金 法 则 可 以 保证 数据 库 处 于 最 佳 状态 。 
一 一 Anon: Where Bugs Go 
































可 顾 第 6 章 讲 过 的 完整 性 约束 (简称 约束 )， 不 严格 地 讲 ， 约 束 是 一 个 布尔 表 
达 式 ， 结 果 必 须 为 TRUE《〈 和 否则 ， 数 据 库 中 就 会 产生 错误 )。 再 回顾 一 个 黄金 法 则 
(The Golden Rule)， 即 要 求 完 整 性 约束 必须 要 满足 一 组 声明 范围 。 换 名 话说 ， 

个 单独 的 声明 就 是 一 个 完整 性 单元 , 没有 声明 (特别 是 ， 没 有 修改 声明 ) 就 会 使 数 
据 库 处 于 不 一 致 的 状态 。 在 本 章 中 ， 我 们 来 仔细 看 看 SQL 的 相关 特征 。 


13.1 数据 库 约 束 


在 SQL 中 数据 库 约 束 采 用 CREATE ASSERTION 定义 ， 与 Tutorial D 的 
CONSTRAINT 声明 是 一 致 的 。 在 第 6 章 中 讨论 了 5 个 可 能 的 “商业 规则 ”并 通过 
实例 展示 了 如 何 使 用 CONSTRAINT 声明 来 实现 这 些 规则 。 现 在 我 们 来 看 看 与 
CONSTRAINT 声明 相似 的 CREATE ASSERTION。 注 意 ， 为 了 方便 比较 ， 还 是 先 
给 出 Tutorial D 格式 。 

1. 供应 商 的 状态 值 必须 在 1 至 100 之 间 。 

Tutorial D 格式 : 


CONSTRAINT CX1 IS_EMPTY ( S WHERE STATUS < 1 OR STATUS > 100 ) }; 


SQL 格式 : 


CREATE ASSERTION CX1 
CHECK ( NOT EXISTS ( SELECT * FROM S 
WHERE STATUS < 1 OR STATUS > 100 ) ) 


过 例子 可 以 看 出 ，CREATE ASSERTION 声明 包含 以 下 几 个 部 分 :(a)〉 关 键 
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词 CREATE ASSERTION; (b ) 约束 的 名 字 , 要 求 紧 跟着 CREATE ASSERTION;〈c) 
关键 词 CHECK, 要 求 紧 跟着 约束 名 ;(c) 放 在 括号 中 的 布尔 表达 式 (必须 为 TRUE)， 
要 求 紧 跟着 CHECK。 





























你 可 能 想到 了 Tutorial D 的 另 一 种 格式 : 
CONSTRAINT CX1 AND ( S , STATUS > 1 AND STATUS < 100 ) ; 
SQL 的 另 一 种 格式 为 !: 


CREATE ASSERTION CX1 
CHECK ( ( SELECT COALESCE ( EVERY ( STATUS >= 1 AND 
STATUS <= 100 ) , TRUE ) 














bp 


FROM S ) ) :; 


2. 伦敦 供应 商 的 状态 值 必须 为 20。 
Tutorial D 格式 : 




















CONSTRAINT CX2 IS EMPTY ( S WHERE CITY = 'London' AND STATUS # 20 ) ; 
SQL 格式 : 
CREATE ASSERTION CX2 





CHECK ( NOT EXISTS ( SELECT * FROM S 











WHERE CITY = 'London' AND STATUS <> 20 ) ) ， 
3. 供应 商号 码 必 须 唯一 。 
Tutorial D 格式 : 
CONSTRAINT CX3 COUNT ( S ) = COUNT (SS { SNO }) ) 
SQL 格式 : 
CREATE ASSERTION CX3 

CHECK ( ( SELECT COUNT ( SNO ) FROM S ) = 
({ SELECT COUNT ( DISTINGT ‘SNO ). FROM”S 了 元 

针对 该 例 强 调 几 点 。 
口 ” 首先， 注意 最 后 一 行 的 COUNT (DISTINCT SNO)。 在 本 书 中 我 们 第 一 次 


























看 到 这 样 一 种 结构 。 不 严格 地 讲 ， 该 结构 的 含义 是 将 COUNT 运算 符 对 S 
中 SNO 进行 投影 运算 〈 即 真正 的 关系 投影 ， 这 样 可 以 消除 重复 )。 为 了 对 
比 差异 ， 考 虑 COUNT (STATUS) 和 COUNT (DISTINCT STATUS)， 仍 
然 用 我 们 常用 的 例子 做 样本 数据 ， 前 者 的 返回 值 为 5， 后 者 的 返回 值 为 3。 
口 “第 二 ， 前 面 SQ 格式 的 有 效 性 不 能 立刻 显示 出 来 。 实 际 上 有 时 会 发 生 一 些 
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1 这 里 给 出 的 COALESCE 实际 上 不 是 必须 的 ， 但 放 在 这 里 也 没有 错 。 详 细 讨 论 请 参见 SOZ and 
Relational Theory。 
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神秘 的 事情 。 如 你 所 见 ，CHECK 声明 的 布尔 表达 式 会 涉及 等 值 比较 ， 要 




















求 操作 数 必须 用 查询 来 表示 ， 而 子 查询 的 结果 是 表格 ， 









































”第 三 ， 还 有 一 种 更 简单 的 方法 来 声明 SQL 约束 ， 即 : 


CREATE ASSERTION CX3 
CHECK ( UNIQUE ( SELECT SNO FROM S ) ); 





因此 就 要 比较 两 个 





表格 的 等 价 性 (然而 在 第 11 章 中 我 们 看 到 SQL 不 支持 这 样 的 比较 )。 所 
以 如 何 进行 比较 呢 ? 我 不 想 在 这 里 揭 开 这 个 谜底 ， 把 它 留 给 读者 去 考虑 。 











当 且 仅 当 变量 表 中 的 行 都 不 相同 时 ，SQL 的 UNIQUE 运算 符 返 回 值 才 为 

















TRUE。 因 此 ， 当 且 仅 当 表 $ 中 不 存在 供应 商号 相同 的 7 




















结果 才 返 回 TRUE。 

















口 ” 当然, 实际 上 我 们 可 以 不 通过 显 式 CREATE ASSERTION 声 明 来 表示 约束 ， 
而 是 通过 在 表 S 的 定义 中 加 入 UNIQUE (SNO) 的 形式 来 表示 !。 但 有 趣 的 















































天 行 时 ，UNIQUE 


是 ， 这 种 说 明 实际 上 只 是 表达 形式 上 的 简化 ， 显 然 显 式 的 CREATE 


ASSERTION 声 明 有 点 见长 。 
4. 供应 状态 小 于 20 的 供应 商 不 能 供应 零件 P6。 
Tutorial D 格式 : 


CONSTRAINT CXx4 




















IS EMPTY ( ( S JOIN SP ) WHERE STATUS < 20 AND PNO = "P6' )，; 





SQL 格式 : 


CREATE ASSERTION CX4 


CHECK ( NOT EXISTS ( SELECT * FROM S NATURAL JOIN SP 














这 是 在 列表 中 涉及 两 个 基本 表 的 第 一 个 例子 〈 即 基本 表 $ 和 SP)。 当 然 ， 通 党 














WHERE STATUS < 20 AND PNO = "P6' ) ) ， 




















情况 下 约束 与 基本 表 的 数量 是 无 关 的 。 而 且 更 重要 的 一 点 是 ，SQL 需要 在 事务 提 























交 时 检测 相应 的 约束 , 因而 , 更 不 季 的 是 SQL 有 时 不 能 支持 黄金 





Rule )。 
5. 表 SP 的 每 个 供应 商号 但 必须 出 现在 表 $ 中 。 
Tutorial D 格式 : 


CONSTRAINT CX5 SP { SNO } SS { SNO } 























1 仅仅 是 为 了 兴趣 ， 现 在 我 来 告诉 你 ， 在 表 $ 中 使 用 UNIQUE (SNO) 说 明 的 标准 语法 格式 〈 我 采 上 


























法 则 (CThe Golden 




















二 











标准 通用 的 语法 来 表示 这 个 特殊 的 例子 ): 当 且 仅 当 EXISTS(SELECT * FROM S WHERE 
NOT(UNIQUE(SELECT SNO FROM S))) 为 真 时 ，UNIQUE (SNO) 是 不 满足 条 件 的 。 我 希望 已 经 



























































非常 清楚 地 解释 了 这 个 例子 。 
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SQL 格式 : 


CREATE ASSERTION CX5 
CHECK ( NOT EXISTS ( SELECT SNO FROM SP 
EXCEPT CORRESPONDING 
SELECT SNO FROM S ) 


这 个 例子 也 涉及 两 个 基本 表 。 当 然 我 们 也 可 以 不 采用 显 式 CREATE ASSERTION 声 
明 的 形式 ， 而 是 通过 在 表 SP 定义 中 加 入 FOREIGN KEY 说 明 来 表示 这 个 约束 。 但 
是 ， 和 上 面 第 3 个 例子 一 样 ， 这 种 说 明 实 际 上 只 是 表达 形式 上 的 简化 ， 显 然 显 式 的 
CREATE ASSERTION 声明 有 点 见长 。 

对 基本 表 和 列 约束 的 说 明 : 前 面 的 例子 足以 说 明 ， 在 Tutorial D 中 采用 
CONSTRAINT 上 声明 的 任何 约束 ， 都 可 以 采用 SQL 的 CREATE ASSERTION 进 行 声 
明 “。 但 是 SQL 有 一 个 特点 ， 即 这 样 的 约束 都 可 以 在 基本 表 的 定义 中 作为 定义 的 一 
部 分 出 现 来 替代 单独 的 声明 ， 例 如 ， 基 本 表 约 束 (base table constraint )。( Tutorial D 
只 在 定义 中 支持 码 和 外 码 的 约束 ， 而 不 支持 其 他 的 定义 。) 而 且 ，SQL 还 有 一 个 特 
点 ， 即 一 些 约束 可 以 通过 列 约束 ( column constraint ) 的 形式 来 声明 (这 种 声明 不 
仅 是 基本 表 定 义 的 一 部 分 ， 而 且 是 基本 表 中 特定 列 定 义 的 一 部 分 )， 例 如 ， 只 涉及 
一 列 的 NOT NULL 约 束 和 码 约 束 。 但 是 这 些 特 征 基本 上 只 是 语法 上 的 一 些 装饰 ， 进 
一 步 的 讨论 已 经 超出 了 本 书 的 范围 。 






























































13.2 ”类 型 约束 


在 前 面 第 10 章 我 已 经 多 次 提 到 ，SQL 确实 允许 用 户 定义 自己 需要 的 类 型 。 现 
在 这 已 经 成 为 了 一 条 公理 (至 少 有 人 是 这 样 认为 的 )， 即 某 些 用 户 自 定义 类 型 7 了 定 
义 中 的 部 分 必须 确保 是 可 以 构成 类 型 7 的 值 的 规格 说 明 。 通 过 例子 具体 说 明 一 下 ， 
假设 我 们 要 把 表 SP 的 数量 列 〈QTY) 的 类 型 采用 用 户 自 定义 类 型 ， 而 不 是 采用 系 
统 定义 的 类 型 INTEGER (本 书 中 一 直 假 设 使 用 INTEGER 类 型 )。 为 了 简化 问题 ， 
假设 表 SP 中 该 列 的 类 型 名 为 QTY， 与 列 名 一 致 ， 那 么 我 们 要 确定 一 种 表示 合法 数 
量 的 方式 〈 即 类 型 QTY 的 唯一 合法 值 )， 即 确保 在 整数 1 至 5000 之 间 取 值 。 在 
Tutorial D 中 ， 采 用 下 面 的 大 致 格式 定义 QTY 类 型 : 


TYPE :OTY .sw% CONSTRATNT GO > .1 AND 人 -0090. 5 二 3 































































































































































































































































































1 除非 假设 SQL 约束 中 不 包含 “可 能 未 确定 的 表达 式 ”( 参 见 第 11 章 关 于 这 个 术语 的 解释 )。 如 果真 
是 这 样 的 话 , 在 实际 情况 中 可 能 会 引起 严重 的 问题 , 特别 是 ， 如果 表格 表达 式 包 含 了 一 些 字符 串 类 
型 的 子 表达 式 ( 这 是 一 种 很 常见 的 情况 )， 则 儿 乎 所 有 的 表格 表达 式 都 会 被 看 作 是 “可 能 没有 确定 
值 的 ”。 详 细 讨 论 请 参见 SQL and Relational Theory。 





















































符号 2 表示 该 类 型 的 任 一 值 (实际 上 ， 是 任 一 数量 值 )'。 


上 面 的 TutorialD 格式 中 
该 例 中 就 是 要 保证 QTY 的 值 位 于 
类 型 约束 (type constraint)， 即 构成 特定 类 型 的 合法 值 






























































丰登 
口 
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FP 使 用 了 关键 字 CONSTRAINT， 这 也 是 合理 的 ， 因 为 在 
时 的 范围 之 内 。 换 旬 训 





6 说 ,我 们 定义 了 一 个 


的 规格 说 明 。 注 意 ， 在 第 6 章 











讨论 的 约束 (在 本 章 前 面 的 章节 中 也 讨论 过 ) 被 称 为 数据 库 约束 (database 
constraint)， 目 的 是 为 了 和 类 型 约束 加 以 区 分 。 实 际 上 ， 术 语 约束 (constraint) 的 使 
用 是 不 加 限制 的 ， 但 通常 用 来 表示 数据 库 约束 ， 除 非 在 上 下 文 环境 中 加 以 特殊 说 明 。 











在 第 6 章 中 没有 提 到 类 型 约束 ， 这 是 
一 部 分 (相反 ， 却 是 术 
为 ， 允许 用 户 自 定义 类 3 
我 错 了 ，SQL 不 允许 这 样 。 
我 来 解释 一 下 原因 : 
整 型 来 表示 该 类 型 的 值 









































法 的 。) 





因此 ， 在 SQL 中 数量 1,000,000,000 显 


日 关联 的 类 型 到 











LE 论 的 一 部 分 ); 


























SQL 允许 我 们 把 数量 的 类 型 定义 为 QTY， 它 也 允许 采用 











， 但 是 它 不 允许 把 该 类 型 的 合法 值 限 定 在 1 








因为 : 第 一 ， 它 们 本 身 并 不 是 关系 理论 的 


必 





了 二， 我 或 多 或 少 想当然 地 认 
型 的 系统 也 必须 允许 用 户 自己 定义 构成 这 些 类 型 的 值 。 但 是 





至 5000 之 间 。 





然 是 合法 的 !( 所 以 ， 一 1,000,000,000 也 是 合 


当然 ， 我 们 可 以 通过 CREATE ASSERTION 来 弥补 SQL 中 不 支持 类 型 约束 的 
含 该 类 型 的 基本 表 ， 则 





不 足 〈 以 相当 大 的 代价 )。 假 设 2 代表 类 型 QTY， 了 代表 





可 以 表示 为 如 下 格式 : 


CREATE ASSERTION CXQ 


CHECK ( 





NOT EXISTS ( 





SELECT * ERO 
WHERE 0Q < QI] 


OR 





Ea 
© > QTY 





(人 
( 50 


O 和 表 了 都 可 以 采用 CREATE ASSERTION 进行 说 明 。 
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) 
00 ) 





) 
表达 式 QTY (1) 和 QTY (5000) 是 QTY 的 标识 符 。 显 然 ， 














每 一 个 这 样 的 列 


13.1 按照 下 面 的 “商业 规则 ” 写 出 供应 商 -零件 数据 库 的 CREATE ASSERTION 

















a. 所 有 

















b. 不 存在 
Cc. 在 同一 








1 这 个 解释 有 些 过 于 简单 ， 

















时 间 至 多 只 能 有 








色 零 件 的 重量 必须 小 了 
两 个 供应 商 位 于 同一 个 城市 。 





50 傍 。 


























1 个 供 


应 商 所 在 





但 就 目前 情况 来 说 ， 这 就 足够 了 。 














城 了 




















为 牙 
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d， 至 少 存在 一 个 伦敦 的 供应 商 。 
e， 供 应 商 S1 和 零件 PI 必须 位 于 不 同 的 城市 。 





QL 约束 
































































































































EIGHT >= 50 ) ) ; 


多 ， 即 使 目前 





13.2 ”你 钟爱 的 SQL DBMS 文 持 CREATE ASSERTION 吗 ? 
13.3 ”如 果 问 题 13.2 的 答案 是 “no”， 请 说 明 它 支持 其 他 什么 类 型 的 约束 ? 
13.4 你 如 何 处 理 不 能 进行 声明 的 那些 约束 ? 
13.5 请问 SQL 中 为 什么 在 检测 约束 条 件 〈 如 约束 CX4) 时 要 进行 推迟 检测 ? 
人 | 
13.4 ”答案 
13.] a. CREATE ASSERTION CXA 
CHECK ( NOT EXISTS (SELECT * ;FROM.P 
WHERE COLOR = ' Red"' ANDWI 
b. CREATE ASSERTION CXB 
GHECK { tT SELECT COUNT (SNO ) FROM SS ) 二 
( SELECT COUNT ( CITY ) FROM S ) );; 
C. CREATE ASSERTION CXC 
CHECK ( ( SELECT COUNT ( SNO ) FROM S 
WHERE CITY = 'Athens' ) < 2 ) ; 
d. CREATE ASSERTION CXD 
CHECK ( EXISTS ( SELECT * FROM S 
WHERE CITY = 'London' ) ); 
Ge。 CREATE ASSERTION CXE 
CHECK (~ SRELECT COUNT “tt CITY = 
FROM ( SELECT CITY FROM S 
WHERE SNO = 'S1' 
UNION CORRESPONDING 
SELECT CITY FROM P 
WHERE PNO = 'P1' ) AS POINTILESS ) <2 ) ; 
13.2 ”答案 也 许 为 “no”。 实 际 上 ， 完 整 性 约束 已 经 构成 了 一 个 特定 的 领域 ， 
该 领域 中 的 标准 要 比 DBMS 的 大 部 分 标准 〈 不 是 所 有 的 产品 ) 好 的 
还 不 是 很 完美 。 
13.3 ”大 部 分 产品 都 支持 UNIQUE 约束 、PRIMARY KEY 约束 (在 UNIQUE 
约束 的 语法 上 稍微 有 一 些 变化 )、FOREIGN KEY 约束 以 及 其 他 一 些 























人 





的 术语 中 ， 约 束 条 伯 
13.4 这 些 人 可 能 会 如 
发 丹 ” 的 形式 )。 详 细 











\ 语 























”约束 。 后 面 的 基本 表 约 束 通 常 可 以 通过 单独 检测 每 一 行 来 实现 约束 条 件 的 检 

















测 。 换 句 话说 , 约束 条 位 

































































F 中 的 布尔 表达 式 被 限制 为 基本 表 级 别 的 限制 条 件 。( 在 SQL 
F 不 允许 包含 子 查 询 。) 





E 某 些 地 方 来 加 入 一 些 恰当 的 应 用 程序 代码 (可 
讨论 请 参见 SOL and Relational Theory。 

















| | 三 
能 是 


“他 
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A 


13.5 实际 上 , 原因 就 是 SQL 不 支持 类 似 于 Tutorial D 的 多 变量 形式 (参见 第 
6 章 )， 多 变量 可 以 允许 用 户 在 一 个 语句 中 修改 两 个 或 多 个 表 。 例 如 ， 约 束 CX4， 
可 以 执行 下 面 的 UPDATE: 


UPDATE S 
SET STATUS = 10 
WHERE SNO = 'S1' 


如 果 此 时 检查 约束 条 件 , UPDATE 操作 必然 失败 。 但 是 如 果 把 检测 推迟 到 下 面 
的 DELETE 操作 之 后 : 









































DELETE 
FROM SP 

WHERE SNO = 'S1' 

AND PNO = 'P6'; 

那么 ， 这 个 修改 就 成 功 了 。 然 而 ， 如 果 采 用 这 种 方式 来 推迟 检测 ， 那 么 在 从 























UPDATE 到 DELETE 操作 之 间 数 据 库 就 会 处 于 不 一 致 状态 ， 因 此 SQL 就 破坏 了 黄 
金 法 则 (The Golden Rule)。 特别 是 如 果 在 此 期 间 , 执行 修改 操作 的 程序 发 出 询问 : 
“存在 状态 值 小 于 20 的 、 供 应 了 零件 P6 的 供应 商 吗 ? ”答案 一 定 是 Jes。 
注意 : 奇怪 的 是 SQL 实际 上 文 持 多 变量 格式 ! 例如 ， 下 面 的 SQL 语句 完成 了 
把 变量 X、Y、Z 的 值 分 别 赋 值 给 变量 A、B、C。 
SE (A BC er (je 

(实际 上 ， 从 技术 实现 角度 来 说 ， 这 是 一 个 行 赋值 语句 。) 但 麻烦 的 是 ， 赋 值 语 
句 中 的 目标 变量 不 允许 赋值 给 表 变 量 ，。 使 得 事情 变 得 更 加 奇怪 的 是 ，SQL 确 实 能 
够 执行 一 些 特定 的 多 个 表 变 量 赋值 ， 人 至少 采用 隐 式 的 方式 ， 例 如 ， 当 它 执行 “级 联 
删除 时 ”( 参 见 第 3 章 练 习 3.4 的 答案 )。 

































































































































































际 讶 。 
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1 假定 SQL 中 根本 没有 提供 恰当 的 表 变 量 定 义 的 前 提 下 ， 你 也 许 不 会 感到 这 样 | 
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第 14 章 


SQL 与 关系 模型 


在 理想 与 现实 之 间 ， 往 往 会 有 阴影 降临 。 


—T.S.Eliot: 





从 前 面 几 章 的 介绍 可 以 看 出 ，SQL 与 关系 模型 不 是 一 回 





地 说 ，SQL 被 看 作 是 一 种 具体 的 关系 型 语言 ， 


法 和 潜在 的 抽象 关系 模型 相对 应 。 实 际 上 ，SQL 














但 显 





The Hollow Men (1925) 









































过 错 和 代理 的 过 错 ， 一 方面 它 不 能 正确 文 持 〈 或 者 根本 训 


地 方 ， 另 一 方面 它 所 支 持 的 地 方 又 不 能 与 任何 关系 模型 相对 应 。( 当然 












































从 左 到 右 排 序 的 列 等 。 











中 我 只 把 注意 力 局 限 在 这 里 ， 即 只 关心 SQL 的 核心 特征 
好 地 支持 等 价 、 表 类 型 、 关 系 代数 运算 符 。 非 关系 型 特有 


本 书 中 我 的 主要 目的 是 描述 和 解释 关系 模型 ， 
SQL 的 普遍 存在 的 特征 《更 确切 地 说 ， 不 论 好 坏 ， 有 一 点 可 以 坚持 ， 即 数据 库 专 





















































业 人 员 确 实 需 要 面 对 它 , 利用 它 处 理 实际 问题 ) 可 以 为 专业 人 士 提供 




















事 ， 或 者 更 具体 一 点 
然 SQL 在 很 多 方面 都 无 法 把 想 
要 忍受 两 方面 的 过 错 ， 即 省 略 的 
不 支持 ) 关系 模型 的 很 多 
\， 在 整 本 书 





























。) 省 略 的 一 些 例子 可 以 很 
E 的 例子 有 空 值 、 重 复 行 、 











而 不 是 SQL。 但 是 我 认为 给 出 























多 种 方法 解决 


问题 ，SQL 的 这 些 方法 都 违背 了 抽象 模型 的 一 些 规 定 。 实 际 上 ， 我 非常 相信 这 样 
的 专业 人 士 对 关系 模型 本 身 已 经 了 如 指 掌 ， 知 晓 模 型 和 SQL 之 间 的 差异 可 以 对 他 
们 有 所 帮助 ， 因 此 本 章 内 容 就 来 讲解 SQL 与 关系 模型 之 间 的 差异 。 


























14.1 概述 











再 重复 一 下 我 在 第 10 章 讲 过 的 内 容 , 我 确 





























会 比 先 学 习 SQL 再 学 习 关 系 模型 要 容易 些 。 其 











型 的 话 , 会 需要 很 多 未 了 解 的 知识 (因此 本 书 才 按照 这 样 的 结构 来 安 提 
1 章 中 介绍 的 一 样 )。 实 际 上 ， 我 相信 并 不 是 任何 人 都 真正 了 解 SQL 的 方方面面 ， 

































































信 先 了 解 关系 模型 , 然后 再 学 习 SQL 
原因 是 如 果 先 学 习 SQL 再 学 习 关 系 模 
FE， 就 像 在 第 
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SS 














只 是 知道 了 这 种 语言 ， 而 不 是 真正 了 解 它 的 实质 。SQL 如 此 庞大 、 如 此 复杂 、 如 此 
特别 、 如 此 非 正 交 〈 此 处 忽略 了 它 的 逻辑 差异 、 不 一 臻 性、 矛盾 等 )， 经 过 分 析 后 























我 不 得 不 相信 SQL 是 很 难 教会 的 。 我 不 止 一 次 地 遇 到 过 这 样 的 情况 ， 即 我 向 很 多 












































SQL 专家 请 教 一 些 技术 问题 的 答案 时 《我 曾 拜 访 过 SQL 标准 委员 会 的 成 员 或 曾经 的 
成 员 ), 往往 要 等 上 一 些 时 间 才 能 获得 答案 , 即使 答案 是 现成 的 (但 不 总 是 这 样 的 )， 

















这 些 答案 也 不 保证 一 直 是 正确 的 。 


























无 论 如 何 ， 我 希望 你 从 上 面 的 叙述 中 可 以 了 解 到 ， 为 什么 人 们 就 像 我 自己 ) 
都 拒绝 把 现在 主流 的 “关系 型 ”产品 看 作 是 关系 型 的 。 实 际 上 它们 是 SOL 型 产品 : 


















































系 型 DBMS 应 该 远 远 超越 











旦 要 在 易 实现 性 、 优 化 性 和 良好 的 性 能 方面 来 超越 )。 我 简短 地 





它们 支持 的 基本 数据 对 象 是 SQL 表 ， 不 是 关系 。 它 们 支持 的 运算 符 可 以 处 理 SQL 
表 ， 而 不 能 处 理 关 系 。 但 令 人 遗憾 的 是 (不 能 说 是 奇怪 的 )， 我 一 直 坚 信和 真正 的 关 

















只 支持 SQL 的 DBMS 不仅 是 从 可 用 性 的 角度 超越 ， 而 
阐述 一 下 。 



































口 ”可 用 性 : 一 个 不 可 否认 的 事实 就 是 ，SQL 要 比 关 系 模型 复杂 得 多 ， 而 且 它 



































也 没 额外 提供 一 些 有 用 的 功能 。 实 际 上 严格 来 讲 ， 它 提供 的 功能 要 比 关 系 
模型 少 ， 因 为 它 完全 不 是 关系 型 的 (参见 第 7 章 中 关于 此 概念 的 讲解 )。 





口 ”优化 和 性 能 : 首先 我 需要 解释 一 下 优化 器 的 概念 ， 优 化 器 的 功能 之 一 就 是 






































完成 表达 式 的 转换 , 即将 表达 用 户 原始 请 求 的 表达 式 转换 为 另 一 种 逻辑 上 
与 其 等 价 的 表达 式 ， 并 且 要 保证 得 到 等 价 的 结果 ， 而 且 性 能 要 优 于 原始 的 
表达 式 〈《 人 至少 这 是 我 们 所 希望 的 )。( 我 已 经 在 本 书 中 的 某 些 地 方 提 到 过 这 
个 概念 ， 比 如 第 1 章 。) 也 就 是 说 ， 对 于 关系 来 说 可 以 完成 很 多 这 样 的 转 
























































换 ， 但 是 对 于 带 有 重复 行 的 表 来 说 不 能 完成 这 么 多 的 工作 ， 如 果 考 虑 列 的 





顺序 、 考 虑 空 值 由 
(重复 行 、 列 序 、 














一 方面 ， 这 些 特 得 





不 能 完成 众多 的 转换 。 换 句 话说， 这些 非 关 系 型 的 特征 
空 值 ) 都 是 阻碍 优化 的 重要 因素 ， 因 此 会 影响 性 能 ， 另 
F 也 会 使 优化 器 更 加 复杂 ， 所 以 很 难 实现 。 










































































注意 : 这 里 我 又 提出 了 几 点 ,首先 ,你 需要 理解 “不 存在 两 个 等 价 的 SQL”( 我 




















在 第 10 章 曾 提 到 过 )。 


























部 分 。 











口 ”目前 没有 一 球 商 业 产 品 完全 文 持 这 个 标准 (实际 上 ， 如 有 果 考 虑 到 不 一 致 性 
和 我 上 面 提 到 的 那些 ， 没 有 一 款 产 品 能 做 到 这 一 点 )。 
口 “ 同 时， 每 款 产 品 都 具有 自身 特有 的 一 些 特 征 ， 而 这 些 特 征 并 不 是 标准 的 一 















































1 支持 这 些 声 明 的 证 据 (关于 不 














口 而且 ， 这 个 标准 明显 遗留 了 一 些 需 要 在 特定 产品 中 解决 的 问题 。( 例 如 ， 




















一 致 性 及 其 他 特征 ) 可 以 参见 附录 D: SQL 标准 指南 (1997 年 ， 


























Addison-Wesley 出 版 ， 第 4 版 )， 作 者 : 我 和 Hugh Darwen。 
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为 结果 中 的 列 命 名 ， 否 则 这 个 列 就 没有 名 字 。 可 以 参照 第 10 章 练习 10.3 
J 答案。) 你 认为 这 些 产品 都 能 恰好 采用 相同 的 方法 来 解决 这 些 问题 吗 ? 
我 感觉 还 有 义务 提 一 下 ,即使 从 纯粹 的 正规 编程 语言 角度 来 说 ， 以 任何 标准 衡 
量 SQL 的 设计 都 是 很 糟糕 的 。 实 际 上 对 于 语言 设计 的 好 坏 已 经 建立 起 评价 标准 , 我 
记得 应 该 是 : 通用 性 、 简 洁 性 、 完 整 性 、 相 似 性 、 可 扩展 性 、 开 放 性 和 正 交 性 ， 
日 似 乎 没有 任何 证 据 可 以 证 明 SQL 的 设计 符合 上 述 特性 。 
但 有 趣 的 是 ， 为 什么 市 场 上 喜欢 使 用 SQL， 而 不 使 用 关系 模型 呢 (对 于 此 事 
我 有 自己 的 观点 ， 但 我 不 会 在 这 里 表明 )。 氨 今 为 止 ， 无 论 如 何 我 们 都 还 不 得 不 学 
会 忍受 这 种 选择 的 结果 。 即 便 这 样 ， 对 于 SQL 表 的 设计 和 SQL 运算 符 的 使 用 等 规 
则 的 研究 仍然 是 人 们 感 兴趣 的 ， 当 然 目的 是 使 整个 系统 看 上 去 与 真正 的 关系 型 一 
样 。 实 际 上 我 在 第 11 章 曾经 提 到 过 ， 这 些 规则 在 SOL and Relational Theory 一 书 中 
用 很 大 篇 幅 进 行 了 介绍 。 然 而 不 笠 的 是 ， 由 于 SQL 语言 和 当前 SQL 产品 的 设计 原 
因 ， 采 用 这 样 的 规则 反而 会 有 些 痛苦 。 当 然 ， 实 际 上 它 也 没有 被 广泛 采用 。 尽 管 如 
此 ， 我 还 是 强烈 推荐 使 用 它 。 


14.2 SQL 与 关系 模 型 的 不 同 点 


此 部 分 列 出 了 SQL 与 关系 模型 的 不 同 点 ， 主 要 是 为 了 参考 ， 同 时 顺便 进行 一 些 
附加 说 明 。 我 知道 可 能 会 有 人 对 列表 中 的 个 别 术 语 吹 毛 求 疲 ， 一 一 解释 列表 中 这 些 
特性 是 非常 不 容易 的 ， 特 别 是 它 的 正 交 性 (例如 ， 保 证 这 些 特性 都 相互 独立 ， 互 不 
影响 )。 但 是 我 认为 这 些 吹 毛 求 疲 都 不 是 重要 的 ， 重 要 的 是 它们 累积 起 来 造成 的 影 
响 ， 坦 率 地 说 是 相当 惊人 的 “。 
不 再 喝 嗪 了 ， 下 面具 体 来 看 一 下 它们 的 不 同 点 : 
D SQL 不 能 够 完全 区 分 表 的 值 和 表 变 量 。 
D ”SQL 表 与 关系 〈 或 关系 变量 ) 不 同 ， 因 为 它们 不 允许 或 不 需要 (根据 具体 

情况 而 定 ):， (a) 重复 的 行 ，(b) 空 值 (ec) 从 左 到 右 有 序 排列 的 列 ，(d) 

无 名 的 列 ;(e) 重复 的 列 名 ; (f) 指针 (虽然 标准 中 没有 ， 但 至 少 在 某 种 

产品 中 存在 );(g) 隐藏 的 列 。 注 意 : (a)、(b)、(c)、(f) 都 代表 破坏 了 

信息 准则 。(d) 和 “(e)( 即 无 名 的 列 和 重复 的 列 名 ) 可 能 发 生 在 评价 某 个 





过 过 
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pA 




























































































| 内 


















































1 这 个 列表 数据 摘自 Jon Bentley 的 专著 More Programming Pearls: Confessions ofa Coder 第 9 章 一 一 
little Languages (1988 年 ，Addison-Wesley 出 版 。 

2 这 里 我 还 要 用 Wittgenstein 的 名 言 提醒 你 一 下 :所 有 的 逻辑 差异 都 是 巨大 的 差异 。 这 一 点 在 我 和 Hugh 
Darwen 的 一 些 技术 专著 中 曾经 提 到 过 ， 在 本 书 中 也 曾 提 到 过 。 
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表达 式 后 得 到 的 结果 表 中 ， 不 能 出 现在 基 表 或 者 视图 中 。 因 此 严格 说 来 ， 





如 果 我 们 遵守 信息 准则 的 规定 (参见 第 7 草 )， 那 么 (d) 条 


就 不 会 破坏 它 ， 



































允许 我 们 可 以 得 至 





和 〈e) 肯定 会 破坏 信 ， 
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准则 《你 可 能 不 会 相信 )。 


1H (e) 的 情况 
因为 这 样 的 表 就 不 会 出 现在 数据 库 中 。 但 奇怪 的 是 ，SQL 
I 不 直接 存 回 到 数据 库 基 表 中 的 结果 。 因 














此 ,我 认为 (d) 


SQL 没有 恰当 的 表 标 识 符 。 最 接近 于 这 种 结构 的 表示 方式 是 VALUES 表 
达 式 (顺便 说 一 下 ， 处 于 某 种 特定 的 目的 ， 批 准 或 者 算 改 是 经 常 使 用 的 术 
语 )， 这 样 的 表达 式 就 不 
见 本 革 练 习 14.2。) 


























SQL 通常 认为 视图 不 是 绊 
日 稍微 进行 了 修改 : 
SQL 标准 ， 以 及 其 他 大 多 数 的 SQL 文档 通 




















sw 










































































能 用 在 必须 使 用 标识 符 的 环境 中 。( 对 此 ， 可 以 参 
攻 。 下 面 这 段 文字 摘自 SQL and Relational Theory， 


常 都 讨论 了 术语 “ 表 和 视图 ”( 事 实 


上 ， 是 相当 普遍 的 )。 显 然 ， 采 用 此 种 方式 讨论 的 人 受到 了 “ 表 和 视图 不 同 ” 的 影响 ， 


认为 “ 表 ” 着 








































































































在 视图 























就 是 集合 。 这 个 观点 同样 








特别 是 对 于 定义 视 























是 基本 表 ， 基 本 表 是 物理 存储 的 ， 而 视图 不 是 物理 存储 的 。 但 总 的 来 说 ， 
视图 就 是 表 ( 或 者 我 更 愿意 把 它 称 为 关系 变量 )。 也 就 是 说 ， 
是 关系 模型 ) 执行 的 运算 

从 数学 的 角度 来 说 ， 子 集训 


对 规则 的 关系 变量 〈 至 少 
上 都 可 以 执行 ， 因 为 视图 就 是 “规则 的 关系 变量 
i 是 集合 。 实 际 上 ， 基 于 集合 理论 的 操作 结果 得 到 的 


?9 


适用 于 关系 模型 ， 任 何 关系 型 表达 式 的 操作 结果 就 是 关系 ， 

















些 人 是 没有 从 关系 的 角度 考虑 问题 ， 这 有 可 能 会 引发 一 些 错误 。 











SQL 表 《〈 从 前 面 的 叙述 来 看 ， 要 包括 视图 




















解释 ， 请 参照 附录 B〔 这 里 也 说 明了 SQL 不 完全 是 关系 型 的 )。 
SQL 没有 显 式 的 表 赋 值 运算 符 。 
SQL 当然 也 没有 显 式 的 多 变量 表 赋 值 运算 〈 也 没有 类 似 的 INSERIDELETE/ 




















处 理 空 值 的 《有 


























UPDATE 操作 )。 
SQL 在 很 多 方面 都 破坏 了 赋值 规则 (The 4ssignment Principle)， 有 一 些 是 
些 是 处 理 字符 串 类 型 的 ， 还 有 一 些 是 处 理 “ 可 能 的 没有 




















图 的 表达 式 也 是 如 此 。 因 此 ， 认 为 SQL 中 的 视图 不 同 于 表 的 那 


!) 至 少 包 含 1 列 。 对 于 该 点 的 


二} 






























































确定 值 的 ”表达 式 )。 
SQL 在 很 多 方面 都 破坏 了 黄金 规则 (The Golden Rule)， 其 中 包括 处 理 空 






























































值 的 ， 特 别 是 # 


迟 进行 








完整 性 检测 方面 。 


SQL 没有 合适 的 “ 表 类 型 ”定义 。 
SQL 没有 表 之 间 的 “=” 运 算 ， 实 际 上 ， 它 根本 不 执行 表 之 间 的 比较 运算 。 
SQL 允许 把 合适 的 超 码 显 式 声明 为 码 。 




















SQL 的 并 、 交 、 联 接 运 算 不 满足 交换 律 。 


14.2 SQL 与 关系 模型 的 不 同 点 “181 








D SQL 的 并 、 交 、 联 接 运算 不 满足 等 究 性 。 

D SQL 的 并 运算 不 是 联接 运算 的 特例 《重复 值 和 空 值 的 存在 是 罪魁 祸首 )。 

口 ”SQL 中 没有 明确 定义 联接 运算 (原因 是 SQL 表 的 内 容 是 一 组 行 的 包 ， 而 
不 是 集合 )。 

口 ”SQL 没有 适当 的 聚集 运算 符 。 

D SQL 在 处 理 空 集 时 会 产生 各 种 逻辑 错误 ， 包 括 语法 和 语义 方面 的 逻辑 错误 。 

口 ”很 多 SQL 表 的 表达 式 都 是 “可 能 具有 未 确定 值 的 ” 

D SQL 支持 各 种 行 级 的 运算 符 〈 如 游标 的 修改 、 行 级 的 触发 器 等 )。 

口 “ 虽 然 在 SQL 的 标准 中 没有 提供 ， 但 是 某 种 特定 的 商业 产品 中 使 用 的 SQL 
专业 术 话 有 时 确实 会 涉及 物理 级 的 构成 〈 例 如 ， 索 引 )。 

D SQL 的 视图 定义 中 包括 映射 信息 以 及 结构 化 信息 “。 注 意 : 针对 该 点 及 下 
一 点 重要 性 的 详细 讨论 可 参见 我 的 一 本 专著 : View Updating and Relational 
Theory: Solving the View Update Problem (2013 年 ，O?Reilly 出 上 磊 。 

口 SQL 对 于 视图 修改 的 文 持 是 很 薄弱 的 、 针 对 特定 问题 的 、 不 完整 的 。 

口 ”SQL 不 能 正确 区 分 类 型 与 描述 之 间 的 关系 。( 这 个 问题 主要 发 生 在 SQL 的 




























































































































































































































































































子 类 型 机 制 中 ， 但 不 排除 其 他 情况 ， 详 细 讨论 已 经 超出 本 书 的 范围 。) 
口 ” SQL 不 支持 类 型 约束 。 
D SQL 的 “结构 化 类 型 ”有 时 被 封装 起 来 ， 有 时 却 未 被 封装 。 注 意 : 结构 化 




















类 型 是 SQL 用 来 自 定 义 类 型 的 一 种 机 制 。 详 细 讨论 也 超出 本 书 的 范围 。 

D SQL 不 能 正确 区 分 类 型 和 类 型 发 生 器 。 

口 ”虽然 SQL 标准 中 支持 BOOLEAN 类 型 ,但 大 多 数 商 业 化 产品 却 不 支持 该 类 型 。 

D SQL 对 于 “=” 的 支持 是 存在 严重 缺陷 的 。 具 体 来 讲 ,“=” 可 以 〈a) 比较 
的 两 个 数 明显 不 同 ， 但 也 可 以 得 到 TRUE; (b) 两 个 比较 的 数 没有 明显 差 
异 ， 却 不 能 得 到 TRUE; 〈c) 因此 可 以 用 户 自 定义 ， 所 以 在 语义 上 存在 二 
义 性 (特别 是 用 户 自 定义 类 型 中 );(d) 根本 不 支持 定义 XML 类 型 〈e) 

虽然 在 标准 中 没有 说 明 , 但 在 一 些 特定 的 产品 中 也 不 支持 一 些 特 定 的 类 型 
(如 BLOB 和 CLOB)。 

D SQL 是 基于 3- 值 逻辑 的 (可 以 这 样 说 )， 但 关系 模型 是 基于 2- 值 逻辑 的 。 

口 ”如 前 所 述 ，SQL 不 完全 是 关系 型 的 。 

口 ”SQL 不 直接 支持 映像 关系 ， 也 不 文 持 RENAME、XUNION 排他 型 并 运 

算 、MATCHING、NOT MATCHING、D_UNION. I MINUS、 D_INSERT、 

I_DELETE。 还 有 其 他 的 未 在 本 书 讨论 的 关系 运算 符 。 

















































































































































































































1 公平 地 讲 ， 这 个 结论 也 可 以 应 用 于 Tutorial D， 至 少 在 目前 的 情况 下 是 可 以 的 。 
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上 述 列 出 的 条 目 并 不 详尽 。 








14.3 练习 


14.1 从 语义 上 判断 下 面 哪些 是 合法 的 独立 SQL 表达 式 《〈 即 没有 嵌 套 在 其 他 
表达 式 中 的 表达 式 )， 哪 些 不 是 ? (4 和 B 是 表 名 ,假设 这 里 的 表 都 能 够 满足 特定 
运算 的 需求 。) 注意 : 这 个 练习 有 点 不 公平 ， 因 为 在 本 书 中 没有 歼 盖 到 足够 的 SQL 
内 容 来 回答 所 有 的 问题 ， 但 是 我 想 值得 尝试 一 个 ， 对 你 也 会 有 益处 的 。 但 我 至 少 解 
释 一 下 SQL 结构 “TABLE 7”( 了 就 是 一 个 简单 的 表 ， 而 不 是 常用 的 表 的 表达 式 )， 
它 是 表达 式 “(SELECT * FROM 刀 ” 的 缩写 。 也 许 还 要 提醒 你 一 下 ， 在 关系 型 中 ， 
交 运 算是 自然 联接 的 一 种 特殊 形式 。 

a. A NATURAL JOIN B 
INTERSECT B 
ECT * FROM A NATURAL JOIN B 
ECT * FROM A INTERSECT B 
ECT * FROM ( A NATURAL JOIN B ) 

ELECT * FROM ( A INTERSECT B ) 

ECT * FROM ( SELECT * FROM A INTERSECT SELECT * FROM B ) 
ECT * FROM ( A NATURAL JOIN B ) AS C 

ECT * FROM ( A INTERSECT B ) AS C 

j. TABLE A NATURAL JOIN TABLE B 

k. TABLE A INTERSECT TABLE B 

l. SELECT * FROM A INTERSECT SELECT * FROM B 

m. ( SELECT * FROM A ) INTERSECT ( SELECT * FROM B ) 

n. (SELECT * FROM A ) AS AA INTERSECT ( SELECT * FROM B ) AS BB 

从 这 个 练习 中 你 可 以 得 出 什么 结论 ? 

14.2 如果 x+y 是 一 个 数值 表达 式 ，x 的 值 为 3， 我 们 可 以 用 标识 符 3 代替 变 
量 引用 *， 即 3 + 了 《〈 这 个 表达 式 则 和 辑 上 等 价 于 初始 的 表达 式 )。 在 练习 14.1 中 ， 如 
果 我 们 用 一 个 “ 表 标 识 符 ”( 即 恰当 的 带 有 确定 值 的 表达 式 ) 替代 4 或 者 互 ， 那 么 
SQL 表达 式 或 者 蔡 代 后 的 表达 式 会 是 什么 样子 的 ? 
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本 中 





















































14.4 ”答案 


14.1 SQL 表 的 表达 式 采 用 正规 的 BNF 语法 ， 为 了 完整 地 























答 这 个 问题 ， 可 

















14.4 答案 183 


以 参照 SOL and Relational Theory (这 个 练习 中 的 例子 就 摘自 此 书 )。 
RAL JOIN B: 不 合法 
A INTERSECT B: 不 合法 
SELECT * FROM A NATURAL JOIN B: 合法 
FROM A INTERSECT B:， 不 合法 
SELECT * FROM ( A NATURAL JOIN B ): 合法 
E 
E 





DD 
已 
DD 
H 
CA 













































































ROM ( A INTERSECT B ); 不 合法 
ROM ( SELECT * FROM A INTERSECT SELECT * FROM 






























































h. SELECT * FROM ( A NATURAL JOIN B ) AS C: 不 合法 

i, SELECT * FROM ( A INTERSECT B ) AS C: 不 合法 

j. TABLE A NATURAL JOIN TABLE B: 不 合法 

k. TABLE A INTERSECT TABLE B; 合法 

1l. SELECT * FROM A INTERSECT SELECT * FROM B: 合法 

m. ( SELECT * FROM A ) INTERSECT ( SELECT * FROM B ): 合法 

n. ( SELECT * FROM A ) AS aa INTERSECT ( SELECT * FROM B ) 
AS BB: 不 合法 

至 于 从 练习 中 得 出 的 结论 ， 要 依靠 你 自己 的 回答 来 总 结 , 但 是 我 知道 我 自己 得 
到 的 结论 。 

14.2 ”影响 如 下 : 表达 式 b 原来 是 不 合法 的 , 但 现在 变 成 了 合法 的 。 表达 式 c.、 
e.、k.、1.、m. 是 合法 的 ， 但 变 成 了 不 合法 的 。 其 他 所 有 的 表达 式 原 来 是 不 合法 的 ， 
现在 仍然 是 不 合法 的 。 从 这 个 练习 中 你 可 以 得 出 什么 结论 ? 



















































































































































































































































































该 附录 的 


附录 A 
Tutorial D 语法 


我 从 没 用 过 这 样 大 的 了 D。 


一 一 W. S. Gilbert: HMS Pinafore (1878) 
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这 里 给 
省 略 了 : 











目的 是 为 Tutorial D 的 关系 型 表达 式 及 赋 
晶 省 咯 了 非 关系 表达 式 的 一 些 细节 部 分 , 特别 是 包含 聚集 运算 符 调 用 的 部 分 ,所 以 
的 是 用 来 定义 基本 关系 变量 和 约束 操作 的 定义 语法 。 下 面 的 这 几 个 部 分 也 

















值 的 BNF 语法 提供 参考 ， 









































SUMMARIZE， 因 为 该 运算 符 有 些 地 方 被 否决 了 就 像 第 5 章 解释 的 那样 )。 











在 本 书 中 没有 讨论 该 语言 的 具体 4 


























同时 ， 该 语法 在 菜 些 方面 也 被 简化 了 。 
用 映像 关系 ， 对 操作 符 的 优先 级 规则 也 没有 过 多 关注 。( 这 里 提 到 的 优先 级 规则 ， 


指 的 是 语法 中 使 用 上 


四 节 方 面 。 


























特别 是 它 没有 定义 映像 关系 ， 也 没有 使 






































的 结构 ， 如 : 7 MINUS r2 MINUS 3， 计算 顺序 是 没有 明确 定义 


























的 。 因此 需要 男 外 定义 一 些 语法 规则 来 解决 这 些 问 题 ,但 是 本 书 中 省 略 了 这 些 规 则 。 











当然 ， 可 以 使 用 括号 来 保证 计算 顺序 。) 下 面 再 说 明 几 点 : 





A.1 


EE 


















































形 如 <... name> 的 所 有 语义 解释 都 表示 为 <identifier>s, 但 具体 定义 没有 进 


一 步 讨论 。 

















特例 。 























表达 式 


lation exp> 








虽然 <bool exp> 被 态 记 了 了， 未 定义 ， 但 它 有 助 





: := <with exp> | <nonwith exp> 





F 回 想起 关系 型 比较 是 一 种 


通常 情况 下 ， 上 面 提 到 的 各 种 逗号 列表 都 可 以 为 空 。 


186 ”附录 A TutorialD 语法 


<with exp> 
::= WITH ( <temp assign commalist> ) : <relation exp> 


注意 : <temp assign> 在 语义 上 等 价 于 <relation assign>， 除 非 在 <relvar name> 出 
现 的 地 方 引入 一 个 “临时 性 ”的 名 字 。 


<nonwith exp> 
::= <image relation ref> | <relation op> | ( <relation op> ) 


<image relation ref> 
::= !!l<relvar name> | !!( <relation exp> ) | ( <image relation ref> ) 


<relation op> 
::= <relation selector> | <monadic op> | <dyadic op> 


<relation selector> 
: := RELATION [ <heading> ] { <tuple exp commalist> } 
| TABLE DUM | TABLE DEE 


注意 : 在 第 一 个 <relation selector> 格 式 中 ， 只 有 在 <tuple exp commalist> 非 空 
时 ， 才 省 略 可 选 的 <headine> 部 分 ，TABLE DUM 和 TABLE DEE 分 别 是 <relation 
selector>s RELATION {} {} 和 RELATION {} {TUPLE { 他 的 缩写 形式 (参见 附录 也 )。 


<heading> 
:= { <attribute commalist> } 


<attribute> 
:= <attribute name> <type name> 


<monadic op> 
::= <relvar name> | <rename> | <where> | <project> | <extend> 


<rename> 
: := <relation exp> RENAME { <renaming commalist> } 


<renaming> 
::= <attribute name> AS <attribute name> 


<where> 
: := <relation exp> [ WHERE <bool exp> ] 


<project> 
::= <relation exp> { [ ALL BUT ] <attribute name commalist> } 


<extend> 
::= EXTEND <relation exp> : { <attribute assign commalist> } 


<attribute assign> 
::= <attribute name> := <exp> 


A.1 表达 式 187 


注意 : <attribute assigmz> 有 一 种 替换 格式 ， 在 语义 上 等 价 于 <relatiom assign>， 
除非 相应 的 <attribute name> (a) 出 现在 允许 使 用 <relvar name> 的 地 方 ;(b ) 如 果 
讨论 的 属性 是 关系 型 的 值 ， 必 须 出 现在 支持 目标 <relvar name> 的 地 方 。 


<dyadic op> 
: := <relation exp> <dyadic op name> <relation exp> 
<dyadic op name> 
:= UNION | D UNION | INTERSECT | MINUS | I MINUS 
| JOIN | TIMES | MATCHING | NOT MATCHING 


<relation comp> 
: := <relation exp> <relation comp op> <relation exp> 
<relation comp op> 
3 el hr 


A.2 ”赋值 


<relation assignment> 
::= [ WITH ( <temp assign commalist> ) : |] 
<relation assign commalist> ; 


<relation assign> 
::= <relvar name> := <relation exp> 
| <insert> | <d insert>| <delete> | <i delete>| <update> 


<insert> 

::= INSERT <relvar name> <relation exp> 
<d insert> 

::= D_INSERT <relvar name> <relation exp> 





<delete> 








DELETE <relvar name> <relation exp> 
| DELETE <relvar name> [ WHERE <bool exp> |] 








<I delete> 
::= I_DELETE <relvar name> <relation exp> 


<update> 
::= UPDATE <relvar name> [ WHERE <bool exp> |] 
{ <attribute assign commalist> } 


附录 B 
TABLE DUM 和 TABLE DEE 


Tweedledum 和 Tweedledee 
同意 一 战 ; 
为 Tweedledum 说 Tweedledee 
弄 坏 了 他 漂亮 的 拨 浪 鼓 。 
就 在 这 时 飞 来 一 只 可 怕 的 乌鸦 
像 焦 油 桶 一 样 大 ; 
这 吓 坏 了 两 个 英雄 ， 
他 们 忘记 了 他 们 的 争吵 。 
一 一 摘自 一 个 古老 的 英国 童谣 Through the Looking-Glass and What Alice Found 
There， 作 者 Lewis Carroll (1871 年 出 版 ) 
























































在 第 3 章 曾 提 到 过 ， 空 集 (不 包含 任何 元 素 的 集合 ) 是 任何 集合 的 子 集 。 因 此 
空 标题 是 一 个 有 效 的 标题 ， 空 元 组 也 是 一 个 有 效 的 元 组 ， 形 如 : TUPLE { }。 实 际 
上 ， 有 时 也 显 式 地 采用 0-tuple 形式 进行 引用 ， 这 是 为 了 强调 其 中 没有 任何 组 成 元 


素 ， 度 为 0， 有 时 也 称 为 空 元 组 。 在 Tutorial D 中 ， 其 说 明 格式 如 下 : 


































































































TUPLE { } 


注意 : 在 Tutorial D 中 ,语法 结构 TUPLE { } 负 责 2 项 职责 。 因 此 ， 具 体 的 语 
义 要 依据 上 下 文 环境 来 确定 。 

从 上 面 的 论述 还 可 以 进一步 获知 ， 关 系 也 可 以 有 空 标题 ， 如 : RELATION { }， 
度 为 0。 在 Tutorial D 中 ， 其 说 明 格 式 如 下 : 

















RELATION { } body 


其 中 , 大 括号 表示 空 标题 , boqy 可 以 为 { } 或 者 {TUPLE{ }}, 参见 下 面 的 解释 














190 附录 B TABLE DUM 和 TABLE DEE 


也 可 以 参见 附录 A。 

r 表示 度 为 0 的 关系 ,那么 有 多 少 种 这 样 的 关系 呢 ? 答案 是 : 只 有 2 个。 第 一 ， 
当然 了 可 能 是 空 的 〈 即 其 中 不 包含 任何 元 组 ， 回 顾 第 3 章 练习 3.3 的 答案 ， 恰 好 是 
任 一 给 定 类 型 的 空 关 系 )。 第 二 ,如果 > 非 空 ,那么 它 包 含 的 元 组 必须 全 都 为 0-tuples。 
但 是 只 有 一 个 0-tuple〈 即 所 有 的 0-tuple 都 是 相互 重复 的 )， 所 以 7 不 可 能 包含 多 个 
元 组 。 因此， 实际 上 只 有 2 个 不 包含 属性 的 关系 ， 一 个 只 带 有 一 个 元 组 ， 另 一 个 根 
本 不 带 有 元 组 。 而 且 《〈 也 许 令 你 感到 惊讶 )， 这 两 个 关系 是 相当 实用 的 ， 并 且 从 理 
论 上 来 说 也 是 很 重要 的 ， 以 至 于 我 们 为 它们 另 起 了 名 字 ， 即 TABLE_DUM 和 
TABLE DEE， 或 者 简写 为 DUM 和 DEE (DUM 代表 不 具有 任何 元 组 的 空 关 系 ， 
DEE 代表 只 有 一 个 元 组 的 空 关系 )。 

注意 ; Tutorial D 显 式 支 持 关键 字 TABLE DUM 和 TABLE DEE, 虽然 有 时 它 
们 会 采用 简写 形式 。 特 别 是 ， 在 调用 关系 选择 器 时 ，TABLE_DUM 简写 为 : 































































































































































































RELATION { } { } 


同样 ，TABLE_DEE 简写 为 : 





RELATION { } { TUPLE { } } 





(也 可 以 参见 附录 A) 
TABLE DEE 和 TABLE _ DUM 这 么 特殊 的 原因 是 它们 可 以 分 别 被 解释 为 
TRUE 和 FALSE。 顺 便 说 明 一 下 ， 考 虑 供应 商 关 系 变量 $ 在 SNO 上 的 投影 : 

















S { SNO } 











令 了 表示 该 投影 的 结果 《仍然 以 我 们 通常 采用 的 样本 数据 为 例 ,了 包含 了 5 个 
元 组 )。 现 在 考虑 关系 7 在 空 属性 集合 上 的 投影 : 


2 

















显然 , 在 根本 没有 任何 属性 的 元 组 上 进行 投影 将 会 获得 空 元 组 ， 因 而 在 根本 不 

包含 属性 的 关系 x 上 进行 投影 也 会 获得 包含 空 元 组 的 结果 ( 空 元 组 来 自 于 xr)。 但 是 ， 

就 像 从 上 面 例子 中 看 到 的 ， 所 有 的 空 元 组 都 是 相互 重复 的 。 因 此 ， 在 不 包含 任何 属 

性 的 关系 >《〈 就 像 上 面 定 义 的 一 样 ) 上 进行 投影 将 获得 不 包含 任何 属性 的 关系 ， 而 
且 只 有 一 个 ( 空 ) 元 组 ， 即 TABLE_DEE。 

题 外 话 : 前 面 的 段落 说 明了 这 样 一 个 事实 (我 认为 是 显而易见 的 ) ， 定 义 一 个 可 以 用 于 

元 组 而 不 是 关系 的 类 似 的 投影 运算 是 有 意义 的 。 具 体内 容 如 下 : 元 组 上 具有 标题 万 ,了 是 及 

的 子 集 ， 那 么 1 在 人 上 的 (元 组 ) 投影 是 一 个 具有 标题 蕊 的 元 组 ， 即 1 的 子 集 是 由 与 对 中 提 
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到 的 属性 相 一 致 的 上 中 的 构件 组 成 的 。 注 意 : 使 得 类 似 的 元 组 定义 有 意义 的 其 他 关系 运算 符 
包括 EXTEND、RENAME、UNION。 进 一 步 的 讨论 可 以 参见 SOL and Relational Theory， 
可 顾 第 6 章 〈 特 别 是 练习 6.4 的 答案 )， 每 个 关系 变量 〈 实 际 上 是 每 个 关系 表 
达 式 ) 都 有 相应 的 断言 。 对 于 关系 变量 S， 其 断言 形式 可 以 如 下 : 
供应 商 SNO 受到 契约 的 约束 ， 其 名 字 为 SNAME， 状 态 为 STATUS， 所 在 城市 
为 CITY 。 

S 在 SNO 上 的 投影 rx， 可 以 表示 如 下 : 

存在 某 个 姓名 SNAME、 某 个 状态 STATUS、 某 个 城市 CITY， 其 供应 商 SNO 是 受到 

契约 约束 的 ， 其 名 字 为 SNAME、 状 态 为 STATUS、 所 在 城市 为 CITY。 
属性 为 空 的 7 的 投影 rf }， 可 以 表示 如 下 : 

存在 某 个 供应 商号 码 SNO、 某 个 供应 商 名 字 SNAME、 某 个 供应 状态 STATUS、 某 个 
供应 城市 CITY， 其 对 应 的 供应 商 SNO 是 受到 契约 的 约束 的 ， 其 名 字 为 SNAME、 状 态 值 

为 STATUS、 所 在 城市 为 CITY。 

观察 最 后 一 个 断言 ， 它 实际 上 是 一 个 命题 , 虽然 它 乍 看 上 去 有 些 复杂 。 它 无 条 
件 地 评定 为 TRUE 或 者 FALSE 。 在 目前 情况 下 ，r{ } 是 TABLE_DEE， 显 然 该 断言 
(或 命题 ) 评定 为 TRUE。 但 假设 此 时 数据 库 中 根本 没有 供应 商 存 在 ,那么 关系 变量 
S 将 是 空 的 ,投影 S{SNO} 将 得 到 一 个 空 关系 r， 投影 r{ } 将 是 TABLE_DUM, 问题 中 
的 断言 (命题 ) 将 评定 为 FALSE。 

所 以 ，TABLE DUM 就 是 FALSE (或 者 wo)，TABLE DEE 就 是 TRUE (或 者 
yes)。 这 是 它们 最 基本 的 含义 ! 顺便 提 一 下 ， 记 住 它们 最 好 的 方法 就 是 DEE 和 
yes 都 有 一 个 “E” 但 DUM 和 no 没有。 
现在 , 我 们 已 经 陷入 了 某 些 事情 的 一 些 细节 的 困境 ,这 已 经 远 远 超出 了 本 书 的 
范围 ， 所 以 现在 我 要 给 出 一 些 解释 。 首 先 ， 给 出 一 个 DEE 和 DUM 操作 的 具体 例 
子 ， 考 虑 查询 “位 于 雅典 的 每 个 供应 商都 供应 零件 了 吗 ”? 这 是 一 个 yes/no 的 查询 
(也 就 是 说 ， 答 案 或 者 是 yes， 或 者 是 no)。TutorialD 的 语法 格式 如 下 : 
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( ( S WHERE CITY = "Athens' ) MATCHING SP ) { } 








因为 这 个 表达 式 最 终 是 在 无 属性 的 关系 上 进行 投影 , 显然 会 得 到 TABLE_DUM 
或 者 TABLE DEE。 如 果 结 果 为 TABLE DUM， 则 表示 no， 即 在 雅典 没有 供应 商 
供应 了 任何 零件 ， 如 果 结 果 为 TABLE DEE， 则 表示 yes， 即 雅典 的 供应 商 至 少 供 








































































































1 实际 上 ， 如 果断 言 中 的 参数 集合 恰好 为 空 集 ， 则 断言 通常 就 变 为 了 命题 。 注 意 ， 这 种 情况 仅 限于 
前 讨论 的 例子 中 。 上 基体 来 讲 ， 在 投影 r{ } 的 断言 中 ,符号 SNO、SNAME、STATUS、CITY 不 再 表 
示 参 数 本 身 ， 相 反 它 们 表示 的 是 约束 变量 (参见 附录 D)。 
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应 了 一 种 零件 。 


























那么 用 SQL 如 何 表示 呢 ? SQL 中 规定 得 非常 明确 ， 任 何 查询 的 结果 都 是 表 。 但 

















不 幸 的 是 ， 它 忘记 了 支持 的 表 要 表达 的 含义 是 yes 或 者 no 。 所 以 ， 在 SQL 





























FP 不 能 直 





接 完成 yes/no 的 查询 。 实 际 上 ， 针 对 上 面 的 查询 实例 ， 在 SQL 中 最 好 采用 如 下 的 方 



































式 实现 。 首 先 ， 询 问 雅 典 的 供应 商 提 供 了 多 少 零 件 : 


SELECT COUNT ( SNO ) AS Xx 


FROM S 
WHERE CITY = "Athens ' 
AND SNO IN 
( SELECT SNO 
ERO SP ) 











然后 , 从 该 查询 得 到 的 结果 表 中 针对 每 一 行 抽取 出 列 X 的 取 值 .如果 该 值 为 0， 






































则 表示 雅典 没有 供应 商 来 供应 任何 零件 ， 如 果 该 值 为 非 0， 则 表示 雅典 至 少 有 1 个 























供应 商 至 少 供应 了 1 种 零件 。 
我 要 强调 的 另外 一 点 是 〈 在 菜 种 程度 上 ， 它 是 更 通用 的 、 更 基本 的 ): 



































两 个 特 


殊 的 关系 TABLE DUM 和 TABLE_DEE (特别 是 TABLE_DEE) 在 关系 代数 中 所 
起 到 的 作用 类 似 于 传统 算术 中 0 的 作用 。 我 们 都 知道 0 的 重要 作用 。 实 际 上 ， 很 




















由 








难 想象 ， 算 术 中 没有 0 的 话 会 是 什么 样 〈 古 罗马 人 曾经 试图 做 过 类 似 的 寻 
是 也 没有 坚持 多 久 )。 因 此 ， 在 关系 代数 中 如 果 没 有 TABLE_DEE 的 话 ， 
以 想象 的 。 






































有 情 ， 但 


也 是 难 





对 于 前 面 叙述 的 内 容 我 再 给 出 一 些 特殊 说 明 。 首 先 ， 众 所 周知 ， 在 则 辑 运 算 中 





























TRUE 相对 于 AND 运 算是 恒 等 的 〈 我 在 第 5 章 曾 提 到 过 )， 也 就 是 说 ， 如 果 p 是 任意 














一 个 命题 ， 那 么 表达 式 p AND TRUE 和 TRUE AND p 都 被 简化 为 p。 同 样 ， 











在 普通 

















的 算术 中 ，0 与 “+” 等 价 ，1 与 “*” 等 价 ， 即 对 于 所 有 的 数字 x， 表 达 式 x+ 0、0 + 
xX、X* ]、1*x 都 可 以 简化 为 x<。 类 似 地 ， 在 关系 代数 中 ，TABLE_DEE 与 JOIN 等 价 ， 














即 TABLE_DEE 与 任何 关系 x 的 联接 运算 都 简化 为 。 因 此 ， 特 殊 情况 下 ， 因 为 没有 
命题 的 AND 运 算 结 果 为 TRUE， 没 有 数字 的 求 和 运算 结果 为 0， 没 有 数字 的 乘积 运 
































算 结果 为 1， 所 以 没有 关系 的 联接 运算 结果 为 TABLE_DEE。 


























我 再 强调 一 下 ， 你 现在 已 经 知道 了 存在 这 两 个 特殊 关系 ， 而 且 你 会 发 现 它们 可 




















1 它 也 不 支持 空 行 〈 绝 大 部 分 情况 下 不 支持 ， 但 不 是 一 直 不 支持 )， 详 细 解释 请 参见 SQL and 














Relational Theory。 




















2 就 像 我 在 第 4 章 解释 的 ， 如 果 操 作 数 没 有 公共 的 属性 ， 那 么 联接 运算 就 退化 为 笛 卡 儿 乘 积 。 如 果 操 
作 数 之 一 为 TABLE_DEE 或 者 TABLE_DUM， 则 联接 运算 也 退化 为 笛 卡 儿 乘积 。 我 们 正在 讨论 的 















































联接 运算 实际 上 就 是 笛 卡 儿 乘 积 。 
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以 应 用 在 任何 地 方 。 实 际 上 ， 它 们 只 是 nullology 概念 的 特殊 而 重要 的 一 种 表现 形 
式 , 这 些 内 容 我 在 第 3 章 的 脚注 中 都 有 简要 说 明 。 注 意 :我 在 脚注 中 也 讲 过 ,nullology 
与 SQL 的 类 型 null 无 关 ! Nullology 研究 的 是 空 集 ， 理 论 上 严格 ， 而 且 相 当 实 用 。 
SQL 的 null 理论 上 不 是 很 严格 ， 而 且 使 用 时 也 要 避免 ， 以 免 造 成 麻烦 。 

最 后 ， 或 许 我 应 该 再 讨论 一 点 TABLE DUM 和 TABLE DEE。 首 先 ， 对 于 非 
英语 国家 的 读者 来 说 , 它们 只 是 Tweedledum 和 Tweedledee 的 一 种 文字 游戏 (就 像 
该 附录 中 开头 的 题 辞 一 样 )， 这 是 英国 一 首 童谣 中 的 两 个 人 物 ， 摘 自作 家 Lewis 
Carroll 的 Through the Zooizg-Glass。 其 次 ， 这 两 个 名 字 或 许 有 一 点 可 悲 ， 仅 因为 
这 两 个 关系 不 能 被 合理 地 描述 为 关系 ! (注意 ， 在 前 面 的 讨论 中 ， 我 甚至 没有 试图 
去 勾勒 这 两 个 关系 的 画面 。 实 际 上 ， 只 是 考虑 的 关系 的 概念 ， 而 表 的 概念 已 经 被 完 
全 破坏 了 。) 但 是 在 关系 型 世界 里 ， 使 用 这 两 个 名 字 已 经 很 长 时 间 了 ， 也 许 我 们 也 
不 能 去 改变 它们 。 

















































































































































































































附录 C 


合 论 


集合 的 乐趣 。 





一 一 Anon: Where Bugs Go 
























































































































































































































































理解 集合 理论 可 有 助 于 处 理 数 据 库 。 实 际 上 ， 就 像 第 7 章 提 到 的 ， 关 系 模型 是 
直接 建立 在 这 个 理论 的 某 些 特定 方面 基础 上 的 。 因 此 ， 在 本 附录 中 ， 我 要 简要 介绍 
一 下 集合 理论 的 基础 知识 。 

C.1 什么 是 集合 

Ss 

定义 : 集合 S 是 有 一 组 不 同 的 元 素 构 成 的 ， 换 名 话说 ， 它 的 成 员 就 是 给 定 任 一 
对 象 x， 判断 x 是 是 否 包 含 在 5S 中 ( 即 是 5 中 的 一 个 元 素 )。 注意 这 个 术语 : 集合 可 以 
说 成 是 包含 其 成 员 。 

下 面 给 出 一 个 例子 : 

{2 oe 

这 个 例子 是 标准 的 书面 表示 格式 ， 元 素 封 装 在 大 括号 内 ， 利 用 逗号 分 了 喇 。 强 调 
下 面 几 点 。 

口 “ 集 合 中 不 能 包含 重复 元 素 。 因 此 ， 如 果 书 面 的 表示 中 出 现 重复 的 元 素 〈 按 
照 惯例 , 通常 不 会 出 现 这 种 情况 ), 重复 的 元 素 往往 会 被 忽略 , 例如 { 2,2， 
3,$,5,$,7,7} (尽管 不 可 能 )， 另 一 种 书面 的 表示 为 12,3,$,7}。 

口 ”集合 中 的 元 素 没有 顺序 ， 因 此 ， 例 如 {7,2,5 ,3}， 在 书面 上 可 能 会 有 另 
一 种 表示 形式 。 

口 ”不 包含 任何 元 素 的 集合 称 为 空 集 ， 它 是 唯一 的 ， 记 作 人 ， 有 时 也 记 作 8。 
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口 ”还 有 男 一 个 唯一 的 集合 ， 称 为 全 集 ， 即 包含 了 所 有 感 兴趣 的 元 素 (所 有 感 
兴趣 的 元 素 集合 ， 可 以 是 讨论 问题 的 上 下 文 环境 中 涉及 的 所 有 数据 。 如 前 
面 例子 中 的 所 有 正 整数 。〉 有 时 也 称 为 问题 域 。 

DD ”集合 中 的 元 素 可 以 代表 任何 事物 ， 甚 至 可 以 是 其 他 集合 。 注意: 这 种 描述 
有 点 过 于 简单 了 ， 但 是 也 足以 达到 该 附录 的 目的 。 

JD 集合 中 元 素 的 数量 称 为 集合 的 度 。 注 意 ， 空 集 的 度 为 0。 

目前 ,存在 多 种 集合 的 表示 方法 。 第 一 ， 枚 举 法 ， 即 一 一 列 出 集合 中 的 元 素 。 如 : 
































































































































Se 

然而 ， 枚 举 法 只 适用 于 有 限 集合 ， 但 无 限 集合 也 是 允许 存在 的 。 然 而 ， 在 计算 
环境 下 ， 集 合 必 须 是 有 限 的 。 所 以 在 本 附录 中 对 于 无 限 集合 不 做 过 多 的 讨论 。 

第 二 ， 上 断言 法 〈 或 谓词 法 )。 例 如 ; 
























































{X:Xisaprime AND x < 10 } 





该 规则 定义 了 由 所 有 对 和 象 x 组 成 的 集合 , x 必须 为 质数 而 且 小 于 10 (规则 中 的 
冒号 “: ”可 以 读 作 :“ 就 是 ”)。 当 然 ， 该 例 中 的 集合 与 上 面 采用 枚 举 法 表示 的 集合 
是 相等 的 。 

第 三 ， 替 代 法 。 例 如 : 









































{ x : x is a prime AND x < 10 } 








该 规则 定义 了 由 所 有 对 象 y 组 成 的 集合 ,y=x ,x 就 是 小 于 10 的 质数 。 换 句 话 
说 ， 该 集合 中 的 元 素 为 {4，9，25，49}。 注 意 ; 采用 断言 法 表示 的 规则 当然 可 以 看 
作 是 采用 替代 法 表示 规则 的 一 种 特例 。 

现在 来 定义 集合 的 成 员 关 系 运 算 符 “E”( 该 符号 来 自 于 希腊 字符 的 第 5 个 字 
母 ， 有 时 也 用 epsilon 进行 引用 )。 

定义 : 表达 式 xES 值 为 TRUE， 当 且 仅 当 *x 是 集合 8 的 成 员 。 相 反 ， 表 达 式 x 
4 3 返回 值 为 FALSE， 当 且 仅 当 x* 不 是 集合 5 的 成 员 。 注 意 : 表达 式 读 作 “x 出 现 
在 S 中 ”或 者 “x 属于 S$” 或 者 “x 是 8 的 成 员 ” 当然 ， 表 达 式 x 4 5 的 读 法 也 
是 类 似 的 。 

例如 ，5E {2,3,5,7} 返 回 值 为 TRUE， 而 8E {2,3,5,7} 的 返回 值 为 FALSE。 注 意 : 
在 对 象 x 和 单元 素 集 合 (singleton set) {x}( 表 示 只 包含 1 个 元 素 的 集合 ) 是 有 区 别 的 。 

下 面 以 另外 一 个 定义 来 结束 本 部 分 的 介绍 。 

定义 : 集合 论 是 数学 的 一 个 分 支 ， 与 断言 (谓词 ) 逻辑 有 密切 关系 ， 主 要 目的 
是 处 理 集合 的 特性 。 特别 是 它 依据 已 有 的 公理 规范 定义 了 集合 的 概念 ， 例如， 外 延 
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公理 。 该 公理 说 明 : 当 且 仅 当 两 个 集合 恰好 有 完全 相同 的 元 素 时 , 两 个 集合 才 相 等 。 

该 理论 的 等 价 定义 起 到 一 个 很 关键 的 作用 。 首 先 , 集合 成 员 关 系 的 定义 要 依赖 
于 它 〈 别 访 了 ， 如 果 没 有 测试 5 是 否 与 集合 {2,3,5,7} 中 的 某 个 元 素 相等 的 能 力 ， 我 
们 如 何 判 断 表 达 式 SE {2,3,5,7} 是 否 返 回 TRUE。 其 次 ， 反 过 来 外 延 公 理 也 依赖 于 
它 〈 这 是 显然 成 立 的 )。 


C.2 子 集 和 超 集 


假设 S7 和 82 都 是 集合 ， 二 者 不 是 必然 不 同 的 。 那 么 就 可 以 进行 如 下 定义 : 
定义 : 52 是 81 的 子 集 (符号 表示 : 82SS91)， 当 且 仅 当 52 中 的 每 一 个 元 素 都 
存在 于 S7 中 。S7 是 5S2 的 超 集 (符号 表示 : S1252)， 当 且 仅 当 52 是 $1 的 子 集 。 
强调 下 面 几 点 。 
合 的 每 个 子 集 都 是 一 个 集 
个 


合 Y 
集合 既是 自身 的 子 集 ， 也 是 自身 的 超 集 。 




























































































































































































由 油 


























口 ” 空 集 是 任 一 集合 的 子 集 ， 全 集 是 每 个 集合 的 超 集 。 
下 面 的 定义 与 上 面 定义 是 等 价 的 ， 但 是 介绍 了 一 些 新 的 术语 。 
定义 : 52 包含 于 S1 (符号 表示 : S2SS1)， 当 且 仅 当 52 中 的 每 一 个 元 素 都 存 
在 于 S57 中 。S7 包含 $2 符号 表示 : S1252)， 当 且 仅 当 52 被 包含 于 57 中 。 
强调 下 面 几 点 。 
口 ”每 个 集合 都 包含 其 自身 ， 也 被 包含 于 本 身 中 。 
空 集 被 包含 在 每 个 集合 中 ， 全 集 包 含 每 个 集合 。 
口 通常 采用 术语 集合 包含 (set inclusion) 来 指 代 “cS”， 而 不 是 “二 ” 稍 微 
有 点 乱 )。 
口 术语 : 不 要 混淆 “cS” 和 “E”! 一 个 集合 包含 子 集 ， 但 包括 它 的 元 素 。 然 
而 要 注意 的 是 ， 这 个 标识 符 也 不 是 完全 一 致 的 。 实 际 上 ， 至 少 在 英语 表示 
中 有 时 很 难保 持 它 的 一 致 性 ， 因 为 偶尔 会 有 写作 风格 上 的 一 些 惯 例 ， 要 求 
采用 “错误 的 ”的 单词 。 读 者 要 擦 亮 眼 睛 。 
口 ” 现 在 可 以 定义 集合 $2 和 57 的 等 价 ， 当 且 仅 当 表 达 式 S1552 及 S1252 都 
返回 TRUE 时 ， 则 $2=57。 
我 们 说 82 是 5S1 的 子 集 并 不 排除 82 和 S17 是 同一 个 或 者 是 相等 的 集合 。 如 果 我 
们 想 排除 这 种 可 能 性 ， 就 必须 要 讨论 真子 集 。 下 面 给 出 相应 的 定义 。 
定义 : 5S2 是 87 的 真子 集 (符号 表示 : S25S1) (等 价 的 说 法 : 82 真 包含 于 87 )， 
当 且 仅 当 82 是 $7 的 子 集 ，S2 和 S57 是 不 同 的 〈 即 57 的 某 个 元 素 不 在 S2 中 。5S17 
是 52 的 真子 集 (符号 表示 : S1SS2)( 等 价 的 说 法 : 5S7 真 包含 于 S2)， 当 日 仅 当 52 
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是 S7 的 真子 集 。 





例如 ，S7 为 {2,3,5}，S2 为 {2,5}， 那么 S2 是 87 的 真子 集 ， 它 也 是 自身 的 子 集 ， 





但 不 是 真子 集 〈 集 合 都 不 是 自身 的 真子 集 )。 




















定义 : 给 定 集合 $ 的 究 集 P(5) 是 集合 5S 的 所 有 子 集 构成 的 集合 。 
例如 : 假设 集合 5 为 {2 ,3 ,5 }， 则 其 容 集 P(9) 为 {{},{2},{3},{5},{2， 








S32 











这 个 寡 集 的 度 为 8 (=2 )。 通 常情 况 下 ， 假 设 集合 5 的 度 为 x， 则 窜 集 P(5) 的 
度 为 2 (不 要 起 了 ， 空 集 和 集合 5S 本 身 都 是 5 的 子 集 )。 
































C.3 练习 





设 集合 5 为 {2,3,{2,5},5,{3,7},7,{2,{3,7}} 





C.1 5 的 度 为 多 少 ? 

C.2 表达 式 {3,7}E5 的 值 ? 
C.3 ”表达 式 {3,7}S5S 的 值 ? 
C.4 表达 式 {2,3,7} ES 的 值 ? 
C.5 ”表达 式 {2,3,7}S5 的 值 ? 
C.6 表达 式 { }S5 的 值 ? 
C.7 ”过 集 P(5) 的 度 为 多 少 ? 

C.8 ”存在 使 得 P(X)= 凶 成立 的 集合 对 吗 ? 









































C.4 ”答案 


C3 
C.2 TRUE 
C3 TRUE 
C.4 FALSE 
C.5 TRUE 
C.6 TRUE (这 是 必然 成 立 的 ) 
C.7 2“=128 





C.8 不 存在 。 假 设 什 的 度 为 n， 则 P(B 的 度 为 2。 因 








1H1=0)，P( 芍 与 蕊 不 会 相等 。 因 此 ， 该 题 的 答案 为 不 存 矿 





如 果 n=0，2”=2%=1。 


| .> 














为 2 总 是 大 于 n〔 即 使 


即使 了 是 空 集 。 





Wi 
生态 : 
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C.5 集合 运算 符 

大 多 数 读 者 都 熟悉 集合 论 中 的 并 运算 和 交 运 算 “， 但 在 这 里 从 记录 的 角度 来 定 
义 它 们 。 

定义 : 集合 S2 和 S7 的 并 (符号 表示 : S17 U S2， 有 时 读 作 “Slcup $2”) 是 

对 象 x 构成 的 集合 ，x 或 者 是 S1 的 元 素 ， 或 者 是 $2 的 元 素 ， 或 者 同时 为 S17 和 
52 的 元 素 ， 也 可 以 表示 为 : {x:xES] ORxE5S2}。 

定义 : 集合 5S2 和 S17 的 交 (符号 表示 : S17 由 S2， 有 时 读 作 “Slcap S2”) 是 由 对 
每 x 构成 的 集合 , x 同时 为 SI 和 52 的 元 素 ， 也 可 以 表示 为 : {x :XESI] ANDxES2}。 
集合 的 差 运 算 也 与 此 相似 。 

定义 : 集合 5S2 和 57 的 差 ( 按 照 定义 顺序 表示 为 : $1 - S2)， 是 由 对 和 象 x 构成 
的 集合 ，x 为 87 的 元 素 ， 但 不 是 82 的 元 素 。 即 : {x:xES] ANDx ¢ S52}。 

从 前 面 的 定义 可 以 看 到 ， 集 合 论 的 并 运算 和 交 运 算 分 别 对 应 于 逻辑 运算 符 OR 
和 AND。 差 运算 对 应 于 逻辑 运算 符 NOT。 与 补 运算 相应 的 定义 如 下 。 

定义 : 集合 $ 的 补 〈 符 号 表示 : ~S， 有 时 读 作 “not 8”) 是 由 对 象 x 构成 的 集 
合 , x 不 存在 于 集合 S 中 。 表 示 为 : {x:x ¢& S}。 

然而 ， 如 果 UU 是 全 集 ， 那 么 5 的 补 集 就 是 差 运算 U-S。 实 际 上 ， 差 运算 $1-52 
有 时 也 成 为 52 与 57 的 相对 补 。U-S 称 为 集合 $ 的 绝对 补 。 

另 一 个 有 用 的 运算 符 是 异 或 运算 , 也 称 为 对 称 差 , 与 逻辑 运算 符 XOR 对 yy ( 排 
他 性 的 或 )。 

定义 : 集合 $2 和 S17 的 异 或 是 由 对 象 x 构成 的 集合 , x 或 者 是 $1 的 元 素 , 或 者 
是 52 的 元 素 ， 但 不 同时 是 S17 和 52 的 元 素 。 表 示 为 : {x:xXES] XORxE5S2}。 

注意 : 目前 在 异 或 运算 符 的 符号 表示 上 还 未 达成 一 致意 见 。 部 分 原因 是 在 附录 
的 其 余部 分 ,我 要 使 用 关键 字 来 表示 各 种 运算 符 , 如 : UNION INTERSECT、MINUS 
( 差 运算 或 相对 补 )、COMP (绝对 补 ) 和 XUNION ( 异 或 运算 或 对 称 差 )。 





















































































































































































































































C.6 练习 


假设 S7 为 {2,3,5,7}，S2 为 全,3,5,7,9}， 请 计算 下 列表 达 式 的 值 。 
C.9 Sl1 UNION S52 

C.10 SI INTERSECT S$2 

C.11 SI MINUS S52 





















































1 参见 第 4 章 练 习 4.5。 
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C.12 S2 MINUS 51 
C.13 S51 XUNION 53S2 
C.14 3S7 MINUS (S1 MINUS S2 ) 
C.15 ( S1 MINUS S2 ) UNION ( S2 MINUS S51 ) 
C.16 CoMP ( Ss1 ) 


C.7 


C.9 


Ar 一 一 
答案 


{ 1 ,2,3,5,7,9} 


C.10 {3,5,7} 


C.11 


{2} 


C.12 {1,9} 
C.13 {1,2,9} 
C.14 ” {3,5,7} (与 C.10 类 似 ) 
C.15” 行 ,2,9} (与 C.13 类 似 ) 


C.16 








该 题 的 答案 要 依赖 于 全 集 ， 为 了 简化 问题 ， 


成 的 集合 ， 则 COMP(57) 的 结果 为 {1,4,6,8,9}。 


C.8 





至 此 ， 在 该 附录 


一 些 特 性 











假设 全 集 为 1 至 9 的 整数 构 











FP 我 们 已 经 讨论 了 除 “E ”之 外 的 所 有 运算 符 ， 这 些 运 算 符 的 


输入 和 输出 都 是 集合 ， 即 我 们 是 在 一 个 封闭 的 系统 中 来 讨论 这 些 运算 符 的 。 除 此 以 

















外 ， 还 有 一 些 特性 ， 具 体 如 下 '。 
交换 律 : 二 元 运算 符 Op 具 有 交换 性 , 当 且 仅 当 对 于 所 有 的 4 和 B, 满 EE 4 Op 























B 三 B Op 4*。 集 合 运 算 符 





律 。 





符 














UNION、INTERSECT、XUNION 都 满足 交换 





结合 律 : 二 元 运算 符 Op 具有 交换 性 ， 当 日 仅 当 对 于 所 有 的 4、B 和 C， 
满足 4 Op (3 Op C) 三 (4 Op B) Op C。 集 合 运算 符 UNION INTERSECT、 











XUNION 都 满足 结合 律 。 





1 大 部 分 的 特性 都 可 以 采用 文 氏 图 的 形式 来 表示 《〈 留 给 读者 练习 















































)。 注 意 : 如 果 你 不 熟悉 文 氏 图 的 定 


义 ， 可 以 在 关于 逻辑 学 的 基础 知识 书 中 找到 解释 ， 例 如 可 以 参见 Robert R. Stoll 的 Set Theory and 


Logic ( 


























1965 年 由 W. H. Freeman and Company 出 版 ，1979 年 



































] 中 级 语法 风格 ， 该 部 分 始终 采 





2 这 里 采 




















Dover Publications 再 版 ) 。 


























j 这 种 风格 。 同 时 ， 符 
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口 ”分 配 律 : 二 元 运算 符 Opx 可 以 分 配给 二 元 运算 符 Opy， 当 且 仅 当 对 于 所 有 
的 4、B 和 C, 满足 4 Opx(B Opy OO 三 (4 Opx B) Opy (4 Opx C), 集合 运 
算 符 UNION 和 INTERSECT 都 相互 满足 分 配 律 。 

口 “ 祖 等 律 : 二 元 运算 符 Op 满足 窜 等 律 ， 当 日 仅 当 对 于 所 有 的 4， 满足 4 Op 
4 三 4。 集 合 运 算 符 UNION 和 INTERSECT 满足 容 等 律 。 

口 “ 豚 收 律 : 二 元 运算 符 Opx 吸收 二 元 运算 符 Opy， 当 且 仅 当 对 于 所 有 的 4 
和 B, 满足 4 Opx (4 Opy B) = 4。 集 合 运算 符 UNION 和 INTERSECT 项 

目 满 足 吸收 律 。 

同时 ， 还 具有 如 下 性 质 : 

德 摩根 定律 








































































































COMP ( A UNION B)== (COMP (A) ) INTERSECT ( COMP ( 
COMP ( A INTERSECT B ) = ( COMP (A) ) UNION ( COMP ( 








”假设 UU 是 全 集 ， 则 满足 如 下 性 质 : 








A UNION UU 三 U 


员 
SD 





SD 
a 
之 
上 
〇 
乙 
六 
| 
吧 mm 





中 
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证 明 下 列 恒等式 成 立 或 者 不 成 立 : 

C17 (AMINUS C) MINUS ( BMINUS C ) = ( A MINUS B ) MINUS C 

C.18 ( A INTERSECT B ) UNION C = C INTERSECT ( B UNION A) 

C.19 A INTERSECT ( B MINUS C ) = ( A INTERSECT B ) MINUS 
( A INTERSECT C ) 






























































C.10 ”答案 


我 给 出 练习 C.17 的 答案 ， 只 是 为 了 说 明 这 样 的 问题 如 何 进行 证 明 的 过 程 '。 
C.17 该 恒等式 是 有 效 的 ， 证 明 如 下 : 






































x€( (AMINUS C ) MINUS ( B MINUS C ) ) 当 且 仅 当 

















1 也 可 以 采用 文 氏 图 表示 。 
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XE 
xE€A 
xE€A 
xE€A 
xE€A 
xE€A 
XE 


和 6 


C.11 


下 列 条 们 


C 集合 论 


A MINUS C ) 


AND x4 ( B MINUS C ) 当 且 仅 当 


AND x ¢4 CAND (x¢B OR xEC) 
AND ( x4gBOR xEC ) ) 当 且 仅 当 


AND ( x¢C 


AND ( (x¢CANDx¢B) OR (人 


AND ( x¢C 


AND x 4 B ) 当 且 仅 当 


AND x 4 BAND Xe C 当 且 仅 当 


A MINUS B ) 
A MINUS B ) 


AND x 4 C 当 且 仅 当 
MINUS C 


集合 代数 








F 放 在 一 起 构成 了 集合 代数 : 


当 且 仅 当 


x#gCAND xEC) ) 当 且 仅 当 


(a) 集合 局 定义 为 给 定 集合 8 的 军 集 P(3); 


(b) 运算 符 UNION、IN 


(c) 





























TERSECT、COMP 可 以 作用 于 U 中 的 元 素 ; 


包含 运算 符 “S” 可 以 作用 于 忆 中 的 元 素 。 


包 性 〈 适 月 
适 月 
适 月 
适 月 


nh mn 
lI 

















工 
cu 
mM 


~ 
mn mn 
证 





适 月 
适 月 





HY ES YN 


ha 
a 
池 省 
MM 
lt 1 由 





UNION 和 

















日 于 
日 于 
日 于 
日 于 


于 UU 
于 UU 


























在 集合 代数 中 ， 全 集 U 起 着 很 重要 的 作用 。 男 外 集合 代数 还 满足 如 下 规则 : 
INION、INTERSECT、COMNP) 
INION、INTERSECT) 

INION、INTERSECT) 

INION、INTERSECT， 相 互 满足 ) 

INTERSECT 对 于 @ 和 UU 满足 同一 律 ) 
INION、INTERSECT) 

INION、INTERSECT， 相 互 满足 ) 





回归 律 (COMP (COMP(4)) 三 4 
互补 律 4 UNION (COMP(4)) = UAINTERSECT(COMP(4))== 0 














德 摩根 定律 








A2ACB 





《参见 前 面 的 叙述 ) 





恒 等 律 ， 下 面 这 些 表 达 式 永远 成 立 ， 


A UNION B= 8 
A INTIERSECT 号 三 又 
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华 卡 儿 乘 积 


下 面 开 始 讨论 集合 理论 是 如 何 为 关系 型 
这 个 问题 不 想 讨论 大 多 )。 














LE 论 服务 的 (但 仅仅 是 开始 , 我 故意 针对 














定义 : 有 序 对 <x;y> 由 两 个 元 素 x 和 y 构 成 的 ，x 称 为 第 一 元 素 ，y 称 为 第 二 元 素 。 
更 准确 地 讲 ，<x;y> 是 集合 {x},{xy}} 的 简写 。 该 集合 中 的 元 素 即 决定 了 有 序 对 中 的 
元 素 ， 也 决定 了 元 素 的 顺序 '。 

从 该 定义 中 可 以 得 到 如 下 定义 ， 有 序 对 <x1,y1> 和 <x2,y2> 相 等 ， 当 且 仅 当 x7 
=x2 且 y1=y2〔( 因 此 ， 通 常情 况 下 ，<x;y> 关 < )。 

现在 来 定义 第 卡 儿 乘积 ”: 

定义 : 集合 S17 和 52 的 笠 卡 儿 乘 积 (注意 顺序 ) 是 由 所 有 形 如 <x;y> 的 有 序 对 
构成 的 ， 其 中 x 属于 S1,y 属 于 52。 
注意 , 集合 $7 和 52 的 笛 卡 儿 乘 积 实 际 上 就 是 一 个 二 元 关系 , 因此， 有 如 下 定义 。 
定义 : 集合 S17 和 $2 的 二 元 关系 (注意 顺序 ) 是 集合 S17 和 82 的 笛 卡 儿 乘 积 世 


































































































































































































子 集 











举 个 例子 ,假设 S17 为 {13}，82 为 {2,3,5}， 则 集合 ST 和 52 的 二 元 关系 如 下 (只 
给 出 了 四 种 形式 ) >: 


下 
和 
(oe 

{> ,} 











给 出 最 后 一 个 定义 : 
定义 : 函数 就 是 二 元 关系 ， 其 中 没有 任何 两 个 元 素 的 第 一 组 成 部 分 是 相同 的 。 
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下 面 对 于 集合 论 给 出 一 些 总 结 。 如 你 所 见 ， 我 们 已 经 涉及 了 很 多 内 容 ， 这 些 内 
容 对 于 理解 目前 的 内 容 是 足够 的 , 但 是 当然 还 有 很 多 内 容 。 我 希望 这 些 足 以 激 起 你 
的 兴致 。 如 果 你 还 想 了 解 更 多 ,我 建议 你 阅读 曾 在 该 附录 中 提 到 的 那 本 书 ( 见 脚注 
2), 即 《集合 论 与 逻辑 》, 作 者 Robert R. Stoll((1965 年 由 W. H. Freeman and Company 
出 版 ，1979 年 由 Dover Publications, 再 版 。〉， 当 然 也 可 以 阅读 与 内 容 相 关 的 其 它 
材料 。 











































































































1 你 可 能 认为 这 个 定义 破坏 了 一 种 情况 ， 即 元 素 x 和 y 相等 (因为 表达 式 { x},{xy})} 就 变 成 了 {x}})。 
日 实 际 上 不 会 破坏 ， 详 细 原 因 已 经 超出 了 本 书 的 范围 。 

2 集合 论 的 笛 卡 儿 乘积 与 关系 模型 的 笛 卡 儿 乘积 不 完全 一 样 。 因 此 ， 集 合 论 的 二 元 关系 与 关系 模型 也 
不 完全 一 样 。 详 细 讨 论 参 见 SOL and Relational Theory 一 书 中 的 附录 A。 

3 作为 练习 ， 给 出 这 四 种 关系 的 表格 形式 。 


































































































附录 D 


如 果 它 是 这 样 ， 就 可 能 是 ; 
如 果 它 已 经 这 样 ， 就 将 是 ; 
但 当 它 不 是 时 ， 它 就 不 是 。 
那 就 是 逻辑 . 
一 一 Lewis Carroll: Through the Looking-Glass and What Alice Found There 
(1871 年 出 版 ，TWweedledee) 











就 像 第 7 章 提 醒 注 意 的 一 样 ， 关系 演算 相当 于 关系 代数 的 奉 代 品 , 在 表示 方式 
上 是 等 价 的 。 它 建立 在 断言 算术 的 基础 上 (也 被 称 作 是 断言 逻辑 )， 实 际 上 ， 它 是 
断言 算术 的 一 个 剪裁 版 本 ,专门 用 来 处 理 关 系 。 而且， 关系 模型 的 相关 知识 也 不 能 
说 是 非常 完整 的 ， 因 为 它 至 少 没有 包含 算术 的 基本 知识 。 因 此 ， 在 该 附录 中 ， 针 对 
这 个 主题 给 出 一 个 简单 的 说 明 。 

该 附录 的 计划 如 下 : 依照 这 些 介绍 性 的 评论 ,将 展示 一 系列 简单 的 例子 ,这些 
例子 主要 涉及 查询 和 约束 ,目的 是 给 出 形 如 “操作 ”的 算术 表达 式 的 核心 思想 和 表 
示 形 式 ， 同 时 给 出 这 些 表 达 式 的 语法 。 然 而 请 注意 ， 我 没有 在 该 附录 中 描述 商业 上 
使 用 的 语言 ， 也 没有 描述 任何 与 工业 应 用 相近 的 事情 。 实 际 上 , 我 只 是 给 出 并 使 用 
一 种 假设 层面 的 语法 ， 但 这 足以 起 到 说 明 的 目的 。 
算术 的 一 个 最 基本 特征 就 是 域 变量 。 简 言 之 , 域 变量 就 是 在 某 些 特定 关系 范围 
内 的 变量 ( 即 允 许 变 量 的 值 取 自 那 个 关系 中 的 元 组 )“。 所 讨论 的 关系 一 般 都 是 特 
定 关 系 变 量 的 当前 值 。 因 此 ， 如 果 定 义 域 变 量 RV 的 取 值 范 围 为 关系 R， 那 么 在 任 一 
给 定时 间 ， 表 达 式 RV (实际 上 是 域 变量 的 引用 ) 表示 在 关系 "范围 内 的 某 些 元 组 ， 






























































































































































行 














































































































1 你 可 能 会 记得 ， 前 面 我 们 曾 遇 到 过 域 变 量 ， 尽 管 只 是 在 SQL 的 环境 下 《参见 第 11 章 练习 11.1d 的 
答案 )。 特 别提 醒 ， 域 变量 不 是 通常 编程 语言 中 使 用 的 变量 ， 相 反 ， 它 是 逻辑 层面 的 变量 。 
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关系 /恰好 是 讨论 的 关系 R 的 当前 取 值 。 例 如 ,考虑 “查询 伦敦 供应 商 的 供应 商号 码 ”， 
































采用 关系 演算 表示 的 语法 如 下 : 


RANGEVAR SX RANGES OVER 5; 
{ SX.SNO } WHERE SX.CITY ='London' 


























该 表达 式 中 有 一 个 域 变量 SX， 它 的 范围 是 供应 商 变 量 S 的 值 ， 该 值 由 表达 式 
第 二 行 的 关系 演算 表示 计算 得 到 。 该 表达 式 可 以 读 作 (不 严格 地 讲 ， 这 种 解释 有 点 
生硬 ):“ 对 于 域 变量 SX 中 的 每 一 个 可 能 的 元 组 〈 换 名 话说 ， 是 当前 出 现在 关系 变 
量 S 中 的 每 个 元 组 )， 返 回 该 元 组 的 SNO 值 ， 当 且 仅 当 该 元 组 的 CITY 值 为 伦敦 。” 





木 语 : 






































































































































把 WHERE 子 名 前面 的 部 分 称 为 原 元 组 (proto tuple)， 就 像 前 面 关 系 演 














算 表达 式 例子 中 的 第 二 行 ， 因为 在 计算 整个 表达 式 值 的 时 候 , 它 代 表 了 出 现在 结果 
直 中 的 元 组 的 原型 "。 所 以 ， 关 系 演算 的 语法 格式 如 下 : 

















proto tuple WHERE bool exp 








该 表达 式 将 对 包含 特定 元 组 的 关系 进行 取 值 , 这 些 特定 元 组 的 值 为 通过 布尔 表 
达 式 所 确定 的 原 元 组 的 取 值 , 而 布尔 表达 式 的 值 必须 由 WHERE 子 句 判断 为 TRUE。 































































































通过 前 面 的 介绍 ， 接 下 来 给 出 一 系列 实例 (查询 实例 和 约束 实例 ) 来 加 深 对 内 
容 的 理解 。 

















注意 : 为 了 简化 ， 在 大 部 分 表达 式 中 省 略 了 域 变 量 定 义 〈 例 如 ， 





RANGEVAR 说 明 ), 但 在 实际 情况 下 必须 使 用 域 变量 。 作 为 替代 , 假设 域 变量 SX、 
SY 等 定义 在 关系 变量 S 上 , 域 变量 PX、PY 等 定义 在 关系 变量 P 上 , 域 变量 SPX、 
SPY 等 定义 在 关系 变量 SP 上。 而且， 还 对 有 必要 说 明 的 一 些 例子 给 出 了 详细 的 解 
释 ， 这 些 例子 的 结果 都 不 能 直观 地 得 出 。 



























































D.1 查询 实例 


1. 查询 状态 值 大 于 20 的 巴黎 供应 商 的 号 码 和 状态 值 。 






































{ SX.SNO , SX.STATUS } WHERE SX.CITY = 'Paris' AND SX.STATUS > 20 








2. 查询 位 于 同一 城市 的 供应 商 x 和 ?了 的 供应 商号 码 对 。 





{ XNO 


:= SX.SNO ，YNO := SY.SNO } 
WHERE SX.CITY = SY.CITY AND SX.SNO < SY.SNO 





1 术语 原 元 组 (proto tuple)， 用 在 这 本 





























民 恰 当 的 ， 但 不 是 标准 的 。 实 际 上 ， 目 前 还 没有 一 个 标准 的 





[a 
Fu 
—~~ 




















术语 来 表示 该 部 分 的 名 称 。 


3 
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查询 提供 零件 P2 的 供应 商 的 所 有 信息 。 
{ SX.SNO , SX.SNAME , SX.STATUS , SX.CITY } 
WHERE EXISTS SPX ( SPX.SNO = SX.SNO AND SPX.PNO = 'P2' ) 


解释 : 如 你 所 见 ，WHERE 子 句 





式 表示 : 


EXISTS RV 


RV 是 域 变 量 
是 另 一 个 布尔 表达 式 。 





为 TRUE。 因 
口 “ 系 统 会 检测 关系 变量 
及 域 变量 SX， 
是 任意 的 。 
口 “ 考 虑 这 样 的 














(2 





EE，EXISTS RV 是 一 个 量词 (quantifier, 确切 地 说 是 存在 量词 )，bx2 
整个 布尔 表达 式 px7 的 返回 值 为 TRUE， 当 且 仅 当 至 少 存在 
一 个 元 组 (该 元 组 位 于 外 部 ， 可 能 值 来 自 RV) 使 得 内 部 的 布尔 表达 式 bx2 返回 值 


而 ， 我 们 可 以 想象 这 个 例子 





















































FP 的 查询 执行 过 程 如 
和 S 的 当前 值 中 的 元 组 ( 即 关系 变量 8 S， 因 为 原 元 组 涉 


FP 的 布尔 表达 式 〈 称 为 px7) 可 以 采用 如 下 形 


















































7 

















它 的 取 值 范围 就 是 关系 变量 S 











式 就 蔡 换 为 如 下 形式 ; 











)， 每 次 检查 一 个 元 组 ， 顺 序 





个 元 组 ， 即 供应 商 S1 的 元 组 ，WHERE 子 句 中 的 布尔 表达 




















EXISTS SPX ( SPX.SNO = 'S1' AND SPX.PNO = 'P2' ) 
显然 ， 当 且 仅 当 关 系 变量 SP 当前 包含 供应 商 S1 和 零件 P1 时 ， 该 表达 式 的 返 
回 值 为 TRUE。 样 本 数据 仍然 按照 本 书 中 使 用 的 数据 ， 因 此 关系 变量 $ 中 供应 商 















































S1 的 元 组 就 成 为 最 终结 果 的 一 部 分 。 


口 ” 然 后， 系统 就 转向 去 判断 关系 变量 
有 的 元 组 都 被 检测 完毕 。 





























针对 这 个 例子 ， 再 强调 以 下 几 点 : 





口 


ya = 





符号 表示 











然 使 











术语 : 


问题 : EXISTS 通常 采 
了 该 关键 词 ， 即 EXISTS 。 


ES 的 另 一 


个 元 组 ， 











EE 复 这 个 过 程 直到 所 


| 









































被 量化 的 域 变量 要 受到 问题 中 量词 














的 





] 反 写 的 E 表示， 即 习 ,但 在 该 附录 中 仍 








民 制 ( 即 域 变量 所 出 现 的 整个 























演算 表达 式 )， 不 受 限制 的 域 变量 被 称 作 





是 受 限 的 ， 而 SX 就 是 自 




















的 。 

















变量 。 如 该 例子 中 的 SPX 就 











该 例 中 的 原 元 组 实际 上 包含 了 相应 关系 变量 的 所 有 属性 ， 为 了 简化 ， 可 以 
日 简写 成 如 下 形式 : 


把 这 样 








的 原 元 旨 


{ SX } WHERE EXISTS SPX ( 


4. 





查询 至 少 供 





应 了 一 个 红色 零件 的 供应 商 姓 





SPX.SNO = SX.SNO AND SPX.PNO = 'P2' ) 





名 。 
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{ SX.SNAME } WHERE EXISTS SEX ( SX.SNO = SPX.SNO AND 
EXISTS PX ( PX.PNO = SPX.PNO AND PX.COLOR = "Red' ) ) 


























或 者 等 价 地 表示 为 (但 是 在 前 束 范式 中 , 所 有 的 量词 必须 出 现在 WHERE 子 句 
的 布尔 表达 式 之 前 ): 
= SPX.SNO AND 


{ SX.SNAME } WHERE EXISTS SPX ( EXISTS PX ( SX.SNO = 
PX.PNO= SPX.PNO AND PX.COLOR= 'Red' ) ) 




















无 论 哪 一 种 方式 , 该 例 中 要 注意 的 一 点 是 出 现在 EXISTS RV (bx) 量 化 表达 式 中 


的 布尔 表达 式 bx 目 身 涉及 再 次 量化 的 问题 。 
5. 查询 至 少 供应 了 一 种 由 供应 商 S2 提供 的 零件 的 供应 商 姓名 。 
























































{ SX.SNAME } WHERE EXISTS SPX ( EXISTS SPY ( SX.SNO = SPX.SNO AND 
SPX, PNO = SPY.PNO AND 
SPY.SNO = 'S2' ) ) 











观察 一 下 ， 这 个 表达 式 中 有 两 个 不 同 的 域 变量 ， 但 取 值 范围 是 相同 的 。 注 意 : 


实际 上 我 们 可 能 想 在 该 例 中 WHERE 子 名 的 布尔 表达 式 中 加 入 如 下 成 分 (但 确切 的 
原因 是 什么 呢 ? ): 


AND SX.SNO #'S2" 





























6. 查询 供应 了 所 有 零件 的 供应 商 姓名 。 


{ SX.SNAME } WHERE FORALL PX ( EXISTS SPX ( SPX.SNO = 
SPX.ENO’ 一 





SX.SNO AND 
PX.PNO ) ) 





解释 : 如 你 所 见 ，WHERE 子 句 的 布尔 表达 式 ( 和 暂且 称 作 px7) 可 以 表示 为 如 
下 形式 : 


FORALL RV ( bx2 ) 





同 EXISTS RV 一样 ， FORALL RV( bx2 ) 也 是 量词 (专门 称 作 全 称 量词 )。 琴 站 
布尔 表达 式 bx7 返回 值 为 TRUE， 当 且 仅 当 取 自 RV 的 元 组 集合 中 的 每 个 元 组 都 使 


口 


得 布尔 表达 式 bx2 的 返回 值 为 TRUE, 因此 我 们 可 以 想象 一 下 该 例 的 具体 执行 过 程 : 
系统 检测 关系 变量 S 当前 值 的 所 有 元 组 ， 一 次 检查 一 个 ， 次 序 是 任意 的 。 
假设 考虑 供应 商 S1 的 元 组 ，WHERE 子 句 中 的 布尔 表达 式 就 可 以 替换 为 
如 下 形式 : 

= PX.PNO ) ) 


FORALL PX ( EXISTS SPX ( SPX.SNO = 'S1' AND SPX.PNO = 


or 
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当 且 仅 当 关系 变量 SP 当前 包含 了 供应 商 S1 以 及 零件 号 为 Px 的 元 组 〈 每 个 零 
件 号 Px 都 会 出 现在 关系 变量 P 中 的 当前 值 中 )， 则 该 表达 式 的 返回 值 为 TRUE。 仍 
然 采 用 本 书 中 的 样本 数据 ， 因 此 关系 变量 $ 的 供应 商 S1 的 元 组 就 成 为 最 终结 果 的 
一 部 分 。 

口 “ 然 后 系统 继续 检测 关系 变量 中 的 另 一 个 元 组 ， 这 个 过 程 反复 进行 ， 直 到 所 
有 这 样 的 元 组 都 被 检测 完毕 。 
针对 该 例 ， 再 强调 几 点 : 

口 “ 符 号 表示 问题 : FORALL 通常 采用 倒 写 的 A 表示 ， 即 vv， 但 在 该 附录 
仍然 采用 关键 词 FORALL。 
口 一 个 “好 的 ”例子 足以 使 存在 量词 表达 式 的 返回 值 为 TRUE, 然而 一 个 “ 坏 

的 ”例子 足以 使 一 个 全 称 量词 表达 式 的 返回 值 为 FALSE。 
任何 涉及 FORALL 的 布尔 表达 式 都 可 以 转化 为 采用 EXISTS 的 形式 ， 规 则 
如 下 : 






































































































































UD 













































































FORALL X ( bx ) = NOT EXISTS X ( NOT bx ) 


因此 第 6 个 例子 可 以 替换 为 如 下 形式 : 


{ SX.SNAME } WHERE NOT EXISTS PX ( NOT EXISTS SPX 
( SPX.SNO 
SPX.PNO 








SX.SNO AND 
PX.PNO ) ) 


题 外 话 : 前 面 的 讨论 对 于 SQL 有 专门 的 规则 ， 因 为 SQL 不 支持 FORALL， 虽然 
它 支持 EXISTS”。 这 种 情况 的 一 种 结果 就 是 看 上 去 自然 用 FORALL 实 现 对 查询 可 能 
很 难 在 SQL 中 表示 。 针 对 这 种 情况 ， 可 以 参见 第 11 章 练 习 11.1e 的 答案 。 

7. 查询 没有 供应 零件 P2 的 供应 商 姓 名 。 


{ SX.SNAME } WHERE NOT EXISTS SPX 
( SPX.SNO = SX.SNO AND SPX.PNO = 'P2" ) 















































8. 查询 至 少 供应 了 由 供应 商 S2 提供 的 所 有 的 供应 商号 码 和 所 在 城市 。 


{ SX.SNO , SX.CITY } WHERE FORALL SEX ( SPX.SNO #'S2' OR 
EXISTS SPY ( SPY.SNO 
SPY. PNO 

















SX.SNO AND 
SPX:. PNO" ) 少 











解释 : 查询 供应 商 SX 的 号 码 和 所 在 城市 ， 而 SX 要 满足 对 于 所 有 的 供应 关系 














1 当然 ， 反 过 来 也 是 可 以 的 。 
2 实际 上 可 以 说 ， 它 对 EXISTS 的 支持 也 是 有 缺陷 的 (参见 SQL and Relational Theory)。 
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SPX, 要 么 没有 提供 供应 商 S2 所 提供 的 零件 , 或 者 提供 了 供应 商 S2 所 提供 的 零件 ， 
那么 就 存在 一 个 与 供应 关系 SPX 中 零件 号 相等 的 供应 关系 SPY。 
9. 查询 零件 重量 大 于 16 磅 ， 或 者 由 供应 商 S2 提供 的 零件 号 码 。 


RANGEVAR PV RANGES OVER ( { PX.PNO } WHERE PX.WEIGHT > 16.0 ， 
{ SPX.PNO } WHERE SPX.SNO = 'S2' ) :; 





























{ PV.PNO } WHERE TRUE 





强调 几 点 : 

口 ”该 例 中 的 域 变 量 PV 的 取 值 范围 是 关系 变量 P 和 SP 在 PNO 上 的 投影 的 并 
集 。 但 要 注意 PV 的 定义 要 按照 次 序 依赖 于 域 变量 PX 和 SPX。 

口 ”如 果 没 有 说 明 WHERE 子 句 ， 则 默认 存在 形 如 WHERE TRUE 的 子 句 。 
而 该 例 中 的 演算 表达 式 就 简化 为 : 


{ PV.PNO } 


























男 























10. 查询 每 个 零件 的 号 码 及 重量 ， 零 件 重量 采用 殉 表 示 。 














{ PX.PNO , GMWT := PX.WEIGHT * 454 } 

















11. 查询 所 有 的 供应 商 ， 每 个 供应 商都 赋予 标识 符 “Supplier” 作 为 标志 。 





{ SX , TAG := 'Supplier' } 








12. 查询 每 个 供应 关系 的 详细 信息 ， 包 括 供 应 零件 的 总 量 。 














{ SPX , SHIPWT := PX.WEIGHT * SPX.QTY } WHERE PX.PNO = SPX.PNO 




















13. 查询 每 个 零件 的 号 码 及 该 零件 的 供应 总 数量 。 








{ PX.PNO ，TOTY := SUM ( { SPX } WHERE SPX.PNO = PX.PNO , QTY ) } 






































调用 SUM 的 第 一 个 变量 是 一 个 关系 ， 通 过 另 一 个 关系 演算 表达 式 的 形式 进行 
说 明 。 
14. 查询 供应 商 零件 的 总 数量 。 




















{ SUM ( { SPX } ,§ QTY ) AS GRANDTOTAL } 








15. 查询 存储 量 超 过 5 的 红色 零件 所 在 的 城市 。 

















{ PX.CITY } WHERE COUNT ( { PY } WHERE PY.CITY = PX.CITY 
AND PY.COLOR = 'Red' ) > 5 


D.2 约束 实例 











这 是 
1. 供 


AAA 








应 商 的 状态 值 




















CONSTRAINT CX1 NOT EXISTS SX ( 








党 


(不 太 严 格 ) 情况 下 ， 我 们 可 以 说 当 


给 出 了 与 第 6 章 和 第 13 章 相 同 的 5 个 样 
必须 在 1 至 100 之 间 。 


注意 ,如 果 检 测 约束 条 件 时 关系 变量 S 恰好 为 空 ， 





吊 
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例 ( 相 同 的 5 个 商业 规则 )。 


SX.STATUS < 1 OR SX.STATUS > 100 ) ; 











































































































则 


显 


不 存在 任何 蕊 时 《如 域 变 量 蕊 的 取 值 


然 满足 了 约束 条 件 。 通 
直 范 围 


沁 









































恰好 为 空 集 )， 量 词 表 达 式 EXISTS( bx ) 返 回 值 必须 为 FALSE， 无 论 布尔 表达 式 
bx 取 值 如 何 。 因 此 ， 在 同样 条 件 下 ， 其 否定 形式 NOT EXISTS 和 (ax ) 的 返回 值 就 
为 TRUE。 

顺便 说 一 下 ， 依 照 上 面 的 规则 ， 如 果 不 存 在 任何 的 X， 则 FORALLX(po) 的 返 
回 值 也 必须 为 TRUE， 同 样 无 论 布尔 表达 式 bx 取 值 如 何 。 因 此 ， 该 例 的 另 一 个 存 
在 争议 的 、 但 更 具有 用 户 友 好 性 的 格式 如 下 : 
































CONSTRAINT CX1 FORALL SX ( 





SX.STATUS 


之 


2， 伦敦 供应 商 的 状态 值 必须 为 20。 


CONST 
供 


CONST 


RAINT CX2 FORALL SX ( 





3， 供应 商号 码 必须 是 唯一 的 。 


RAINT CX3 FORALL SX (人 








这 个 例子 说 明了 量词 的 男 一 个 作用 (我 们 看 到 的 第 3 种 形式 )。 通 常情 况 
下 ， 量 词 表 达 式 UNIQUE 匀 (bx ) 的 返回 值 














值 〈 不 包括 超出 域 变量 
TRUE。 因 此 ， 该 例 表 


了 范围 的 值 























UNIQUE SY ( 


SX.CITY #'London' 























OR SX.STATUS 


1 AND SX.STATUS 


< 100 ); 


20" 3 


SX.SNO = SY.SNO ) )， 














为 TRUE， 当 上 且 仅 当 恰好 存在 一 个 














的 集合 ) 使 得 布尔 表达 式 px 的 返回 
达 式 FORALL SX ( UNIQUE SY ( 








值 为 
SX.SNO = SY.SNO )) 


























的 含义 为 “对 于 所 有 的 供应 商 SX， 











恰好 存在 一 个 与 











SY”。 例 如 ， 如 果 SX 表 


示 相 同 的 元 组 。 


























4， 状态 值 小 于 20 的 供 


CONSTRAINT CXx4 
FORALL SX ( 








SX.STATUS > 
NOT EXISTS PX ( 


应 商 不 能 供 


示 供 应 商 S4 的 S 元 组 ， 则 
必须 也 表示 供应 商 S4 的 S 元 组 。 换 句 刘 








5 说 ， 通 








[站 











尽 零 件 P6。 


20 OR 


PX.PNO = 'P6" 


说 














AND 


~ 


有 相同 号 码 的 供应 商 








为 了 满足 约束 条 件 ，SY 
情况 下 ，SX 和 SY 必须 表 
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EXISTS SEX ( SPX.SNO = SX.SNO AND 
SPX.PNO 下 次 :NO 一 六 








为 了 提起 作者 的 兴趣 ， 下 面 给 出 该 约束 条 件 的 前 束 范式 形式 : 


CONSTRAINT CX4 
FORALL SX ( FORALL SPX ( FORALL PX 
( SX.STATUS > 20 OR PX.PNO + 'P6' OR 
SX.SNO #SPX.SNO OR SPX.PNO #PX.PNO ) ) ); 




















5. SP 中 的 每 个 供应 商号 码 都 必须 出 现在 S 中 。 


CONSTRAINT CX5 FORALL SPX ( UNIQUE SX ( SX.SNO = SPX.SNO ) ) }; 


D.3 简化 语法 





| 


让 








此 部 分 给 出 了 关系 演算 表达 式 的 简化 的 BNF 语法 。 注 意 ， 在 实际 语言 中 需要 











这 























的 许多 特性 〈 例 如， 书写 关系 标识 符 的 能 力 ) 都 故意 被 忽略 了 ， 是 为 了 集中 精力 了 
解 该 语法 的 本 质 。 


<range var def> 
:= RANGEVAR <range Var name> RANGES OVER <range> ; 


<range> 
:= <relvar name> | ( <relation exp commalist> ) 


<relation exp> 
:= <proto tuple> [ WHERE <bool exp> |] 


<proto tuple> 
:= { <entry commalist> } 


<entry> 
::= <range var name> | [ <attribute name> := ] <attribute exp> 


<attribute exp> 
::= <exp> 


注意 : <exp> 允 许 包 含 <range var de 户 ， 还 可 以 使 用 恰当 的 类 型 标识 符 。 


<range attribute ref> 
:= <range var name> . <attribute ref> 


<bool exp> 
: := 一 切合 法 的 表达 式 | <quantified bool exp> 
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注意 : <bool exp> 允 许 包 含 <range var de 户 ， 其 中 也 可 以 使 用 恰当 的 类 型 标识 符 。 


<quantified bool exp> 
: := <guantifier> ( <bool exp> ) 


<quantifier> 
: := <gquantifier name> <range Var name> 


<quantifier name> 
::= EXISTS | FORALL | UNIQUE 





D.4 练习 











写 出 下 列 查询 和 约束 的 关系 演算 表达 式 : 

D.1 查询 所 有 的 供应 关系 。 

D.2 ”查询 由 供应 商 S2 提供 的 零件 号 。 

D.3 查询 状态 值 在 15 一 25 之 间 的 供应 商 信息 。 

D.4 ”查询 状态 值 小 于 供应 商 S2 的 状态 值 的 供应 商号 码 。 

D.5 ”查询 由 巴黎 所 有 供应 商 提供 的 零件 号 。 

D.6 碍 询 由 伦敦 供应 商 提供 的 零件 号 。 

D.7 ”查询 伦敦 供应 商 没 有 提供 的 零件 号 。 

D.8 ”查询 所 有 的 零件 号 码 对 ， 这 些 零 件 由 某 些 供应 商 同 时 提供 。 
D.9 所 有 红色 零件 的 重量 必须 小 于 50 磅 。 

D.10 不 能 有 两 个 供应 商 位 于 同一 城市 。 
D.11 任何 时 候 至 多 有 一 个 供应 商 所 在 城市 为 雅典 。 
D.12 ”至少 存 在 一 个 伦敦 的 供应 商 。 

D.13 ”供应 商 S1 和 零件 P1 不 能 位 于 同一 城市 。 
























































































































































>EE -过 























































































































Ar = 
D.5 合 亲 





在 本 附录 中 ， 假 设 域 变量 的 形式 为 SX、PX、SPX。 

D.1 { SPX } 

D.2 { SPX.PNO } WHERE SPX.SNO = 'S2， 

D.3 { Sx } WHERE SX.STATUS 之 15 AND SX.STATUS < 25 

D.4 { SX.SNO } WHERE UNIQUE SY ( SY.SNO = 'S2' AND SX.STATUS 












































< SY STATUS. :) 
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D.Ss { SPX.PNO } WH 





PRE FORALL SX ( SX.CITY 'PéAris' OR EXISTS 














SPY ( SPY.SNO = SX.SNO AND SPY.PNO = SPX.PNO ) ) 





D.6 { SPX.PNO } WH 








E UNIOQUE SX ( SX.SNO= SPX.SNO AND SX.CITY 





= 'London' ) 





D.7 { SPX.PNO } WH 


 'London' ) 





D.8 { XNO := SPX.PNO , YNO := SPY.PNO } WH 


SPY.SNO 





3 





'R 








E FORALL SX ( SX.SNO SP¥.SNO OR SX.CITY 





工 





RE SPX.SNO 








D.9 CONSTRAINT DX9 FORALL PX ( PX.WEIGHT < 50 ) }; 


D.10 CONSTRAINT DX10 FORALL SX ( UNIQUE SY ( SX.CITY 


SY CIE 汪 








区 





D.11 CONSTRAINT DX11 COUNT ( { SX } WHERE CITY = 'Athens' ) 


a 











D.12 CONSTRAINT DX12 EXISTS SX ( SX.CITY = 'London' ) }; 
D.13 CONSTRAINT DX13 NOT EXISTS SX ( NOT EXISTS PX ( SX.SNO 
= 'S1' AND PX.PNO = 'Pl' AND SX.CITY # PX.CITY ) ) ; 














附录 EE 
进 阶 阅读 指南 
我 不 介意 你 慢 慢 思考 ， 


但 我 介意 你 的 出 版 物 比 你 想象 的 要 快 。 
Wolfeang Pauli (节选) 




















关系 数据 库 技术 含有 丰富 的 内 容 ， 其 中 一 项 就 是 与 SQL 有 关 的 。 这 个 附录 从 你 
可 能 感 兴趣 的 两 个 来 源 对 已 经 发 表 的 观点 进行 了 解释 (以 专著 或 者 论文 的 形式 )。 注 
意 : 首先 我 要 致 梁 ， 因 为 我 的 名 字 多 次 以 作者 或 联合 作者 的 方式 出 现在 列表 中 ， 而 
不 管材 料 的 特点 如 何 , 这 种 状态 或 多 或 少 是 不 可 避免 的 (如 果 你 原谅 我 这 样 说 的 话 )。 




























































































E.1 E.F.Codd 的 论文 


DD “Derivability, Redundancy, and Consistency of Relations Stored in Large Data 
Banks”， 源 自 IBM 研究 报告 RJ599 (1969 年 8 月 19 日 发 表 )。“A Relational 
Model of Data for Large Shared Data Banks”， 源 自 C4CM13 第 6 期 (1970 

年 6 月 。 注 意 : 第 一 篇 论文 后 来 又 重新 发 表 在 4CM SIGMOD Record 38 

第 1 期 (2009 年 3 月 ), 第 二 篇 论文 重新 发 表 在 CACM26 第 1 期 Milestones 

of Research 上 ， 选 择 的 都 是 1958 年 一 1982 年 的 论文 (C4CM 25th 

Anniversary Issue)。 

1969 年 发 表 的 论文 是 Codd 第 一 次 阐述 关系 模型 ， 是 1970 年 发 表 的 论文 的 

基础 。 但 1970 年 发 表 的 论文 在 某 些 兴 趣 领 域 有 所 差异 ， 主 要 是 1969 年 的 

论文 中 允许 使 用 关系 的 值 属性 ， 但 1970 年 发 表 的 论文 中 没有 使 用 。 因 此 在 

1970 年 的 论文 中 ，Codd 第 一 次 拓宽 了 应 用 领域 ，1970 年 的 论文 被 认为 是 

该 领域 中 的 一 个 标志 性 的 论文 , 但 这 么 说 对 于 1969 年 的 先驱 者 来 说 有 些 不 

公平 ， 所 以 我 建议 每 一 位 数据 库 专业 人 士 每 年 至 少 阅 读 一 篇 这 样 的 论文 。 
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口 “Relational Completeness of Data Base Sublanguages”， 作 者 为 Randall J. 
Rustin， 发 表 在 Data Base Systems, Courant Computer Science Symposia 
Series 6, Englewood Cliffs, NJ:Prentice Hall (1972 ) 。 








在 这 篇 论文 中 ，Codd 第 一 次 整理 


8 了 最 初 的 关系 代数 和 关系 演算 的 定义 。 

















虽然 阅读 起 来 不 太 容 易 ， 但 这 是 对 绩 密 科学 研究 的 回报 。 




















口 “Further Normalization of the Data Base Relational Model” 作者 为 Randall J. 








Rustin， 发 表 在 Data Base Systems, Courant Computer Science Symposia 
Series 6, Englewood Cliffs, NJ:Prentice Hall (1972 ) 。 























基础 。 





SE 





而 是 对 关系 变量 的 进一步 处 型 























在 该 论文 中 ，Codd 定义 了 2NF 和 3NF， 为 数据 库 设 计 理 论 莫 定 了 领域 研究 
日 标 题 容易 误导 读者 ， 进 一 步 规范 化 不 是 在 关系 模型 上 完成 的 事情 ， 
或 者 是 对 关系 变量 设计 的 进一步 处 理 。( 在 第 9 









































章 我 们 已 经 看 到 ， 关 系 模型 本 身 并 不 关心 数据 库 是 如 何 设 计 的 ， 而 上 只 是 关心 
问题 的 设计 是 否 破坏 了 关系 模型 的 规则 。 警告 : 该 论文 中 的 INF 定义 与 本 














书 前 面 给 出 的 定义 有 所 区 别 ， 实 际 























上 是 不 正确 的 《我 将 给 出 理由 证 明 )。 























E.2 C.J. Date 的 著作 


口 ”An Introduction to Database Systems 〈 第 8 版 )， Boston, MA: Addison- Wesley 


(2004)。 

















面向 大 学 层次 的 论著 ,讨论 了 数据 库 管理 的 所 有 方面 (不 单 是 关系 型 的 )。 
SQL 语言 以 SQL:1999 为 范例 ， 但 对 SQL:2003 给 出 了 一 些 注释 。 而 且 还 
专门 对 SQL 的 “对 象 /关系 型 ”特征 进行 了 详细 讨论 (REF 类 型 、 引 用 值 
等 )， 并 详细 解释 了 它们 破坏 关系 型 规则 的 原因 。 注 意 ， 还 有 一 些 涉及 这 

















个 主题 的 论著 如 下 : 






















































































Raghu Ramakrishnan 和 Johannes Gehrke: Database Management Systems 
(3rd edition). New York, NY: McGraw-Hill (2003 )。 

Ramez Elmasri 和 Shamkant Navathe: Fundamentals of Database Systems 
(6th edition). Boston, MA: Addison-Wesley (2010)。 

Avi Silberschatz, Henry F. Korth 和 S. Sudarshan: Database System Concepts 
(6th edition). New York, NY: McGraw-Hill (2010 )。 

Go Faster! The TransRelationalTM Approach to DBMS Implementation. 


Frederiksberg, Denmark: Ventus(2002,2011)。 可 以 从 www.bookboon.com. 


上 免费 下 载 。 
该 论著 描述 了 一 利 






































全 新 的 数据 库 管 理 
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本 的 实现 方法 有 明显 的 区 别 ， 这 些 基 本 的 实现 方法 在 当前 使 用 的 主流 

SQL 产品 中 都 可 以 看 到 。 
Date on Database: Writings 2000-2006，Berkeley，CA: Apress 〈2006 ) 。 
该 论著 是 有 关 数 据 库 各 种 话题 的 文章 集合 , 有 几 篇 是 直接 与 此 书 讨论 的 主 
题 相 关 的 。 特 别 是 它 详细 讨 论 了 SQL 与 关系 模型 的 不 同 点 ， 以 及 因此 而 
产生 的 一 些 负 面 影响 。 相 关 的 章节 是 : 第 8 章 “What First Normal Form 
Really Means” 第 9 章 “A Sweet Disorder”( 关 于 从 左 到 右 的 列 排序 问题 )、 
第 10 章 “Double Trouble, Double Trouble”( 重 复 值 引起 的 问题 )、 第 18 章 
“Why Three-and Four-Valued Logic Don't Work”( 支 撑 SQL 的 空 值 定义 而 
引起 的 逻辑 假设 问题 )。 
SOL and Relational Theory: How to Write Accurate SOL Code (2nd edition). 
Cambridge, MA: O’Reilly (2012)。 
该 论著 在 本 书 前 面 反 复 被 引用 , 题目 简写 为 SOL and Relational Theory。 该 
论著 中 讨论 的 主题 以 及 在 本 书 中 没有 详细 讨论 的 内 容 包 括 : 视图 和 其 他 衍 
生 的 关系 变量 、 重 复 值 的 进一步 讨论 、 类 型 理论 、 关 系 值 属 性 、 多 重 赋值 、 
SQL 语法 、 递 归 查 询 、 元 组 等 价 的 重要 性 、 选 择 器 和 THE 运算 符 、 空 值 
和 3 值 逻 辑 、 如 何 处 理 丢 失 的 信息 、 数 据 维 度 、 优 化 和 表达 式 转 换 、 域 值 
检测 、 谓 词 逻辑 、 更 多 的 关系 运算 符 、 关 系 常 量 及 其 他 。 更 多 的 背景 知识 
可 以 参见 本 书 前 言 中 介绍 的 内 容 。 
Database Desien and Relational Theory: Normal Forms and All That Jazz. 
Cambridge, MA:O’Reilly (2012)。 
View Updating and Relational Theory: Solving the View Update Problem. 
Cambridge, MA: O’Reilly (2013 ) 。 















































































































































































































































C. J. Date and Hugh Darwen 的 著作 


A Guide to the SOL Standard (4th edition), Boston, MA: Addison-Wesley (1997 )。 
该 论著 主要 介绍 了 SQL:1992， 但 也 包含 了 调用 级 接口 特征 CLI 〈1995 年 
发 布 )、 永 久 性 存储 模块 特征 PSM(1997 年 发 布 ), 以 及 后 来 成 为 SQL:1999 
一 部 分 的 一 些 特征 。 尽 管 这 个 标准 在 2011 年 被 重新 编辑 了 ， 但 不 公正 地 
讲 ， 该 著作 包含 了 对 SQL 关系 型 特征 可 靠 的 引用 说 明和 使 用 指南 。 
Databases, Tpes, and the Relational Model: The Third Manifesto (3rd edition )， 
Boston, MA:Addison-Wesley (2007 )。 
该 论著 介绍 并 解释 了 第 三 次 发 布 的 数据 库 


















































、 类 型 及 关系 模型 的 相关 细节 ， 








TT 
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顺便 说 
Functionally Complete?” 包 含 了 对 SQL 5 
绩 密 的 


» -天 呈 


的 








给 出 了 一 个 准确 











的 、 很 正式 的 关系 模型 定义 ， 以 及 支持 类 型 的 理论 (包括 





类 型 继承 的 综合 模型 )。 注 意 ， 这 个 宣言 本 身 只 是 由 

















该 论著 中 很 短 一 个 章 





节 组 成 〈12 页 ， 整 个 论著 超过 了 500 出 。 
Database Explorations: Essays on The Third Manifesto and Related Topics, 
Bloomington, IN: Trafford (2010 )。 





此 乡 


， 该 论著 包含 了 第 三 次 宣 








言 以 及 Tutorial D 语言 的 当前 修订 


版 本 。( 请 








注意 ， 过 去 Tutorial D 并 不 是 第 三 次 宣 
个 宣言 核心 思想 的 一 种 语言 。) 该 论著 也 包含 了 将 Tutorial D 














应 用 的 一 些 假 设 。 注 意 : 
实现 的 各 种 细节 信息 ， 























下 ， 该 论著 第 27 章 的 附 








网 站 www.thethirdmanifesto.com 

以 及 关于 出 
http://dbappbuilder.sourceforge.net/rel.html， 其 中 
Voorhis 提供 的 Tutorial D 原型 实现 ) 代码 的 接 


日 





言 本 身 的 一 部 分 ， 只 是 


一 
已 




















来 解释 这 
E 广 到 工业 级 
给 出 了 Tutorial D 
的 其 他 细节 ， 可 以 参见 网 页 
提供 了 下 载 Rel (由 Dave 



































录 “IS SQL’s 


Three-Valued Logic Truth 














值 及 与 空 值 有 











关 的 特征 的 详细 的 、 综 合 


























E.4 与 SQL 相关 的 其 他 出 版 物 


Donald D. Chamberlin 和 Raymond F. Boyce:“ SEQUEL: A Structured English 
Query Language” 1974 年 ACM SIGMOD 工作 组 发 布 ， 主 要 内 容 描述 了 


口 





数据 























述 、 访 问 和 控制 ，1974 年 5 月，Ann Arbor MI 出 版 。 





就 像 第 10 章 给 出 的 注释 一 样 ， 这 是 第 1 篇 介绍 SQL 语言 的 论文 (最初 的 
名 字 是 SEQUL， 即 结构 化 英文 查询 语言 )。 该 论文 中 描述 的 SEQUL 与 现 
































在 通常 意义 上 理解 的 SQL 存在 
5 没有 空 值 
虽然 支持 






































些 有 是 所 


SELECT 子 句 ， 但 不 存在 “SELECT *” 因 


四 的 差异 ， 例 如 : 








此 如 果 想 获得 伦敦 


所 有 的 供应 商 ， 就 必须 表示 为 : S WHERE CITY = ‘London’。 为 了 获得 





所 有 的 供应 商 ， 必 须 表 示 成 S。 
















































































默认 消除 了 重复 值 (没有 在 “集合 函数 ”中 使 用 , 因 
只 是 在 SQL 标准 中 作为 术语 使 用 ， 月 
FROM 子 句 中 只 能 包含 一 个 表 名 。 换 名 话说 ，SEQUL 不 能 实现 联接 运算 。 
WHERE 子 句 中 比较 式 右边 的 比较 数 可 
查询 这 个 术语 ， 但 在 表达 式 中 用 映射 殖 代 )， 这 种 情况 下 的 比较 式 通常 
是 ANY 或 ALL 的 比较 (参见 SOL and Relational Theory)。ANY 是 默 





日 来 引用 

















为 这 是 很 不 恰当 的 ， 
SUM 和 AVG )。 



































以 是 一 个 子 查 询 (虽然 不 存在 子 
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认 的 ， 可 以 隐 式 说 明 ， 但 语法 本 身 不 支持 ， 使 用 “=” 符 代 〈 默 认为 
“=ANY7”)。 

D 文 持 集合 比较 运算 符 (如 : 集合 包含 等 ) 

D 没有 GROUP BY 子 句 , GROUP BY 功能 
名 中 说 明 。 

0 没有 HAVING 子 句 ， 但 在 WHERE 子 句 中 可 以 调用 “集合 函数 ”来 蔡 
代 此 功能 。 

D 没有 “关联 名 ”( 这 是 最 初 的 SEQUL 术语 中 的 SQL 的 域 变量 )。 相 反 ， 
可 以 标识 一 些 块 ( 在 此 环境 下 ， 它 是 映射 的 男 一 种 说 法 )， 块 标签 可 以 
通过 〈.) 量词 来 引用 。 

2 在 SELECT 子 句 中 诸如 QTY 或 AVG (QTY) 的 表达 式 是 合法 的 ( 即 表 
达 式 中 涉及 “集合 函数 ”调用 ， 或 者 对 列 的 引用 等 等 )， 这 类 表达 式 也 
可 以 用 在 WHERE 子 句 中 。 

D “了 映射 ”可 以 进行 交 运 算 、 并 运算 、 差 运算 等 (这 些 运算 符 都 采用 常用 
的 数学 符号 表示 ， 而 不 是 关键 词 )。 

该 论文 还 讨论 了 SEQUL 与 关系 演算 之 间 的 一 些 差 异 ， 声 明 在 任何 情况 
下 SEQUEL 都 优 于 关系 演算 。 然 而 ， 这 些 声 明和 差异 都 不 能 经 受 住 仔 
细 的 推 殴 和 分 析 。 

国际 标准 化 组 织 (ISO ): Database Laneguage SOL, Document ISO/IEC 9075: 

2011 (2011)。 

它 是 官方 发 布 的 SQL 标准 (2011 版 )。 注 意 它 实际 上 是 国际 标准 ,不 只 是 

美国 国家 或 “ANSI” 标 准 ( 很 多 人 曾 这 样 认为 过 )。 还 要 注意 到 ， 昌 然 

SQL:2011 是 目前 使 用 的 标准 版 本 ， 但 基本 上 此 书 中 讨论 的 所 有 SQL 特征 

都 已 经 包含 在 了 SQL:1992 或 者 更 早 的 版 本 中 。 

Jim Melton 和 Alan R. Simon: “SQL:1999 一 Understanding Relational 

Components” Jim Melton: “SQL:1999—Understanding Object-Relational and 

Other Advanced Features” 分 别 于 2002 年 和 2003 年 由 San Francisco、CA: 

Morgan Kaufmann 发 表 。 

迄今 为 止 ， 我 知道 这 两 部 是 仅 有 的 、 可 以 使 用 的 、 内 容 履 盖 度 广 的 两 部 。 

它们 之 中 的 任何 一 个 标准 都 晚 于 SQL:1992。Melton 担任 该 标准 的 编辑 很 

多 年 了 《现在 仍然 是 ， 而 且 是 在 写作 的 同时 来 担任 此 项 工作 。) 

Stéphane Faroult 和 Peter Robson: The Art of SOL. Cambridge, MA: O’Reilly(2006)。 

该 著作 是 实践 者 的 指南 , 可 以 知道 你 如 何在 当前 的 产品 中 更 好 地 发 挥 SQL 

的 作用 。 下 面 是 经 过 编辑 的 该 著作 的 12 个 章节 标题 : 
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的 前 存在 ， 但 需要 二 FROM 子 
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220 附录 下 进 阶 阅读 指南 


Doo ~ 人 ww 上 iDbD 一 


10. 


I 


12: 


设计 高 性 能 的 数据 库 
高 效 地 访问 数据 库 
索引 

里 解 SQL 的 语句 

里 解 物 理 层 实现 
典型 的 SQL 特性 
处 理 异 构 数 据 
复杂 案例 

并 发 

大 数据 
响应 时 间 

性 能 监测 



















































































该 著作 在 它 的 意见 和 建议 中 没有 偏离 太 多 的 关系 原理 , 实际 上 大 部 分 章节 中 还 
显示 地 表明 了 对 这 些 原理 的 支持 。 但 是 它 也 承认 当今 的 优化 器 还 不 是 很 完美 ， 因 此 


如 何 针对 特定 的 问题 在 许多 逻辑 上 等 价 的 格式 之 外 来 选择 特定 的 SQL 格式 ， 谤 
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作 中 给 出 了 一 些 建议 ， 可 能 会 使 性 能 变 得 更 好 《〈 而 且 还 揭示 了 具体 原因 )。 


E;S 


口 


口 





其 他 图 书 


Patrick Hall、Peter Hitchcock 和 Stephen Todd:“An Algebra of Relations for 
Machine Computation”, Conf. Record of the 2nd ACM Symposium on 
Principles of Programming Languages, Palo Alto, CA (January 1975 ) 。 

该 论文 也 许 有 点 “ 难 ” 但 我 想 它 还 是 很 重要 的 。 在 本 书 中 我 曾经 描述 过 
的 Tutorial D 和 关系 代数 的 版 本 都 可 以 在 这 篇 论文 中 找到 根源 。 


Jim Gray and Andreas Reuter: Transaction Processing: Concepts and 













































































Techniques, San Francisco, CA: Morgan Kaufmann 〈1993 )。 

与 事务 管理 相关 的 标准 文档 ( 见 本 书 第 8 前 。 

Lex de Haan 和 Toon Koppelaars: Applied Mathematics for Database 
Professionals, Berkeley, CA: Apress (2007 )。 

除了 上 面 的 内 容 以 外 , 该 著作 还 以 过 程 代码 的 方式 介绍 了 实现 完整 性 约束 
的 实现 过 程 ( 如 果 需 要 ， 请 参见 本 书 第 13 章 。 
































四 持 步 什 区 
人 民 邮 电 出 版 社 


www.epubit.com.cn 


欢迎 来 到 异步 社区 ! 





异步 社区 的 来 历 


异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 出 版 立 立 F 一 
社 旗下 TT 专业 图 书 旗舰 社区 ,于 2015 年 8 月 上 线 有 溃 年 新 所 角 攻 
运营 。 

异步 社区 依托 于 人 民 邮 电 出 版 社 20 余年 的 IT 。 
专业 优质 出 版 资源 和 编辑 策划 团队 ， 打 造 传统 出 版 | 二 六 锣 s 改 cr 入 or 
与 电子 出 版 和 自 出 版 结合 、 纸 质 书 与 电子 书 结合 、 
传统 印刷 与 POD 按 需 印刷 结合 的 出 版 平台 ， 提 供 最 
新 技术 资讯 ， 为 作者 和 读者 打造 交流 互动 的 平台 。 
































社区 里 都 有 什么 ? 


购 居 图 书 

我 们 出 版 的 图 书 涵盖 主流 IT 技 术 , 在 编程 语言 ` Web 技术 、 数 据 科 学 等 领域 有 众多 经 典 畅销 图 书 。 
社区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 种 ， 部 分 新 书 实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 
定期 发 布 新 书 书 讯 。 




















社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代 码 。 
另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 就 可 以 免费 下 载 。 














与 作 译 者 互动 

很 多 图 书 的 作 译 者 已 经 入 驻 社区 , 您 可 以 关注 他 们 , 咨询 技术 问题 可 以 阅读 不 断 更 新 的 技术 文章 ， 
听 作 译 者 和 编辑 畅 聊 好 书 背后 有 趣 的 故事 ;还 可 以 参与 社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提出 采 
访 题目 。 

















灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购 买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 民 邮 电 出 版 社 书库 发 货 ， 电 子 
书 提 供 多 种 阅读 格式 。 

对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 间 买 到 心仪 的 新 书 。 

用 户 账户 中 的 积分 可 以 用 于 购书 优惠 。100 积分 =1 元 ， 购 买 图 书 时 ， 在 。 : 
里 填 入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


特别 优惠 
购买 本 书 的 读者 专 享 异步 社区 购书 优惠 券 。 


使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 时 输入 57AWG ， 然 后 点 击 “使 
用 优惠 码 ”， 即 可 享受 电子 书 8 折 优惠 〈 本 优惠 券 只 可 使 用 一 次 )。 

















纸 电 图 节 组 合 购买 


社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购买 方式 ， 
价格 优惠 ， 一 次 购买 ， 多 种 阅读 选择 。 
































社区 里 还 可 以 做 什么 ? 


提交 勘误 

















您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 确认 后 可 以 获得 100 积分 。 热 心 勘误 的 读者 还 有 
机 会 参与 书稿 的 审 校 和 翻译 工作 。 


写作 


社区 提供 基于 Markdown 的 写作 环境 ， 喜 欢 写 作 的 您 可 以 在 此 一 试 身手 ， 在 社区 里 分 享 您 的 技 
术 心 得 和 读书 体会 ， 更 可 以 体验 自 出 版 的 乐趣 ， 轻 松 实现 出 版 的 梦想 。 
如 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 享 特色 服务 。 


会 议 活 动 早 知 道 


您 可 以 掌握 IT 圈 的 技术 会 议 资 讯 ， 更 有 机 会 免费 获 赠 大 会 门票 。 





























加 入 异步 


扫描 任意 二 维 码 都 能 找到 我 们 : 











异步 社区 。”。” 微 信 服务 号 。 。” 微 信 订 阅 号 。 。 官方 微 博 。 QQ 群 436746675 
社区 网 址 : www.epubit.com.cn 

官方 微 信 : 异步 社区 
言 万 微 博 ，@ 人 邮 异 步 社 区 ，@ 人 民 邮 电 出 版 社 - 信息 技术 分 社 


投稿 & 咨询 : contact@epubit.com.cn 








